非合作博弈范文
非合作博弈范文(精选12篇)
非合作博弈 第1篇
“囚徒困境”自产生至今一直是博弈论研究的重要课题, 现在的法学界也有许多人对这一问题进行了研究。“囚徒困境反映了一个深刻的哲学问题:个人理性和集体理性的矛盾。
个体为了自己的利益最大, 而不愿意改变决策 (改变决策的结果是不划算, 招了之后惩罚严重) , 导致整体利益最小。这样的情景就是个体与环境博弈的结果, 这种状态就是博弈论中所讲的纳什均衡’”。[1]“纳什均衡”虽然是由单个人的最优战略组成, 但并不是一个总体最优的结果。在个人理性与集体理性的冲突的情况下, 各人追求利己行为而导致的最终结局是一个“纳什均衡”, 也是对所有人都不利的结局。
因此, 我们可以在“囚徒困境”中得到这样一个结论:一种制度 (体制) 安排, 要发生效力, 必须是一种纳什均衡, 否则这种制度安排便很难成立。
在立法过程中, 立法参与者对于所立之法的争夺, 实则是对未来权利的争夺, 此一过程实质是利益之间的博弈和民主参与的价值理念的彰显。而博弈的基础在于“承认不同利益主体的独立性, 没有独立的主体地位, 博弈机制就失去了其动力源泉, 而不同的利益主体正是通过博弈机制进行诉求表达、利益维护和全力争取的。但主体间的利益关系有时是此消彼长的, 一方的过度扩张必然导致另一方的权利收缩, 其结果就必然是一个讨价还价, 各享利益又各分负担。
因此, 博弈机制就成为不同利益间的制衡与平衡的平台和媒介”。[2]在立法过程中, 立法机关考虑利益之间相互影响的前提下, 兼听错综复杂利益主体的呼声, 甄别哪些利益是应当得到承认的, 哪些是不应当在立法中保护的, 最后以法律形式予以确认, 以及通过实施给与确切的保障。
博弈过程中明显处于弱势的参与者, 如行业协会、私营企业与公民大众, 都希望一切利益竞逐依法进行, 将是非交由程序正义公断, 无论立法结果如何, 民主参与的现代法律价值理念已经得到了体现。正如《中华人民共和国立法法》第五条的规定:“立法应当体现人民的意志, 发扬社会主义民主, 保障人民通过多种途径参与立法活动。”根据马克思主义的一般原理, 没有人民的参与, 没有人民的力量, 现实的法律很可能就不是人民需要的法律, 甚至可能是恶法。所以, 惟有民主立法才是法治的保障。“立法博弈在根本上体现的也就是民主参与的价值理念。
因此, 不论是对于己方利益的主张, 还是对于竞争者主张的驳斥, 各方均应以法制为凭, 引经据典, 证明自己的立法策略才是最有利于社会整体利益的”。[3]
2 立法中的非合作博弈过程分析
基于立法理念在各个利益主体间的趋同, 各利益主体之间在己方立法方案内通过参与立法博弈的方式来协调彼此之间的利益冲突, 在彼此策略内找到各利益群体均衡点, 是立法博弈的重要基础, 也是立法参与者各方共同的利益追求。法律的制定是建立在各立法者之间对于同一行政区域内共同利益的高度认同基础上的, 而每一次立法博弈结果的实行又必定会引起利益格局的重塑, 所以在立法方案和立法草案的形成过程中, 立法参与者各方必定有一番利益博弈。下面我们借助非合作博弈模型来分析立法参与者之间的博弈关系, 探究他们各自博弈策略均衡点。
根据非合作性立法博弈模型, 在立法博弈过程中, 各立法参与者是代表各自利益群体的理性人。例如《反垄断法》的制定过程, 就是商务部、工商管理总局和发改委相互博弈的过程, 虽然最后因竞争激烈由上级机关国务院组建“反垄断委员会”而告终, 但是在随后组建的反垄断执法机构中, 上述三个机关均分得了部分权力, 分别成立了反垄断局、反垄断与不正当竞争执法局、价格监督检查司, 从而达到了“纳什均衡”, 这不能不说是立法博弈的结果。但是, 因为基于理性的立法参与者, 如果双方存在误解, 或无法准确判断对方博弈策略, 抑或害怕自己的立法策略不够完善而有可能损害到现有的利益, 那么结果就将是采取不参与博弈的策略, 因为只有选择不参与立法博弈才能最大限度地减少损失的策略, 这种策略也是对对方不博弈策略的最佳回应。
但是, 立法博弈并不必然带来一部良法, 只是提高制定出良法的可能性。这是因为不同群体参与立法的能力存在较大差距, “行政管理部门、国有垄断企业天然地具有优势;而普通民众则处于劣势。弱势群体往往是多数, 代表多数人利益的群体组织不易形成, 而且即使存在这样的组织因为人数的繁杂也不太容易充分发挥作用。”[4]也就是说如果某个立法参与者力量弱小, 则产生的法律完全可能只体现在立法中占有优势立法资源的立法参与者的利益, 这样的法律因为过分注重权利或利益的分配而离良法相距甚远。此外, 立法博弈仅仅是利益群体众多博弈中的一个, 社会中的收入分配问题不可能仅仅靠制定法律就可以完全解决。立法博弈只是提供了一个程序正义的平台, 实质的正义才是人们最终的追求。因此, 笔者认为, 既然问题是在博弈过程中出现的, 那么用非合作博弈理论尝试解决这一问题也未尝不可。
3 解决立法中的非合作博弈缺陷的途径
在利益群体已经多元化的今天, 利益表达的问题, 特别是弱势群体的利益表达问题, 已经是一个无法回避的问题。面对大量的公共问题以及法律与社会严重脱节的情况, 各立法参与者都应当认识到, 传统“闭门造车”式的立法模式必须向开放式的博弈立法模式转变。但由于各立法参与者不同的认知程度和利益权衡, 导致彼此在立法模式选择上存在较大的差别, 这些差别是导致各方在立法过程中不参与博弈的起因。
在现有的体制下某个立法参与者在立法过程中可能占有绝对竞争优势地位, 于是就不愿制定法律来撼动其优势地位, 或者利用自身所掌握的优势来压制其他参与者。这样立法机关所制定出的法律可能因与社会脱节, 或者未能反映其他群体的利益需求而沦为“恶法”或欠缺社会基础的法。在立法博弈中处于劣势的利益群体也可能因立法程序的不公正性而放弃积极的参与态度, 这样, 立法机关最终制定出的法律将大打折扣。欲使弱势群体积极参与立法, 立法者和占据较优立法资源的参与者应当做到:
第一, 使弱势群体认识到制定民主参与的法律不仅仅是营造出有利于彼此的环境, 更强调法律秩序下的合作与发展;
第二, 承诺在法律的制定过程中充分考虑弱势立法参与者的正当利益, 采取适当利益倾斜手段, 这样可提高弱势参与者积极参与立法的意愿;
第三, 设立理性的表达机制, 这一机制应当使弱势民众、利益群体的参与有切实效果, 而且还需要将民主参与化为一种不可剥夺的权利和制定法律的必经程序。法定的权利是利益的最好保障, 由此, 在立法中进行的利益博弈对利益群体就显得尤其的重要。
而且, 各立法参与者通过长期的协商交流, 会逐渐形成一种合作意识, 这种合作意识的形成有利于使各立法参与者的立法逐步顾忌到社会共同利益, 并且随着合作意识的增长, 特别是对开放式博弈立法模式认知水平的提高, 各立法参与者之间将逐步进入深层次的沟通。
参考文献
[1]郭鹏, 杨晓琴.博弈论与纳什均衡.哈尔滨师范大学自然科学学报[J], 2006年第4期.
[2]徐大程.试析立法过程中的利益博弈[D].长春:吉林大学, 2009年.
[3]许章润.从政策博弈到立法博弈——关于当代中国立法民主化进程的省察[J].政治与法律, 2008年第3期.
研发与营销,是合作还是博弈? 第2篇
产销研分离的模式,能够很好的整合不同产品之间的研发资源、生产资源和营销资源。主要的好处体现在对于资源的整合和有效利用上,但是其致命的弱点却是不同子公司之间的沟通成本直线上升,沟通效率的下降。例如:生产公司与销售公司在订单确定、质量问题责任归属等方面都会产生扯皮的现象,而研发部门对销售公司提出的产品要求可能不屑一顾、自玩一套等等。
产销研分离的模式当中,矛盾最尖锐的双方往往是研发和销售。
“换位思考”是一个人人皆知的道理,然而当关系到个人利益与他人利益权衡的时候,很多人又会甘愿去违背它。研发与营销矛盾的根源,主要就来源于双方考虑问题的出发点。
企业在制定激励考核办法的时候,由于缺乏有效的方式将研发和营销捆绑在一起,结果往往针对双方制定的激励考核办法是相互独立的。即研发人员的考核侧重项目完成率,而营销人员的考核则侧重任务完成率。这就导致了研发人员的工作重点会放在新项目的立项、以及立项项目的完成,而对于所立项目是否能够产生效益、产生销量并不关心,因为那是涉及到营销人员的考核而已,自己只需要多立项多结项就可以多拿奖金,
换句话说,研发人员在立项的时候考虑的更多的是要去立那些自己更容易完成、更容易拿到奖金的开发项目,而不是站在消费者的角度,去开发更多能产生经济效益的应市产品。而对于营销系统的人员来说,他们自然希望研发开发出来的每一款产品都能够深受消费者的喜爱,因为这样将便于他们拿到自己的奖金。
于是,营销和研发的矛盾就变得尖锐起来。营销要求的产品,可能研发人员考虑到开发难度大、周期长,不愿意去做。而研发人员开发的产品,营销系统又可能会认为功能过于简单平庸,投入市场后无法起到“一石激起千层浪”的轰动效果,而往往投入大量推广资源后“石沉大海”。
非合作博弈 第3篇
关键词:网络安全;主动防御;非合作动态博弈;攻防博弈
中图分类号:TP393 文献标识码:A 文章编号:1674-7712 (2012) 16-0061-01
一、引言
在现有的网络技术中,一般采用安全策略配置的方法来设置网络防火墙,进而对网络起到保护作用,然而这类型的静态博弈方式有着一些弊端,比如,对于网络攻击者的供给意图和攻击策略无法实时的做出合理的应对,防御方式显得过于程式化,无法抵挡多变的网络攻击,对于一些瞬间和未知的攻击不能起到防御的作用。对于广大用户来说,最为安全、最为理想的防御系统,就应该具备对付所有攻击行为和修复系统弱点的效果。虽然这个想法有点不符合实际,但是整个方向还是相对正确的。因此在设置网络安全防御系统的时候,必须考虑系统的适度安全性。本文通过对非合作、非零和动态博弈理论进行了全面的分析,提出了相关的信息动态博弈防御模型,并且对完全信息和非完全信息条件下的适用场景做了科学的研究,体现网络安全防御技术的可操作性,以提高网络安全主动防御技术的水平,促进防御技术的改革与创新。
二、动态博弈的网络安全防御技术相关的定义描述
(一)完全信息动态博弈主动防御模型(ADDG)
(二)攻防博弈树T定义介绍
三、对于多阶段非合作动态博弈防御技术的分析
(一)攻防博弈树的形成
攻防博弈树可以用来表述完全信息网络攻防动态防御行为,因为攻防博弈树可以将参与网络攻击者和防御者的对抗形式和策略完全体现,可以通过攻防博弈树清楚地了解局中人的行动时间、行动方式、行动策略,以及在行动后的收益情况。
(二)多阶段非合作动态博弈算法简介
1.完全信息多阶段动态博弈逆向归纳法
在完全信息的网络状态下,结合攻防博弈树的防御技术,通过多阶段动态博弈逆向归纳法的计算,可以得出所有可能的网络攻击途径,以及网络防御的最佳策略。需要注意的是,在计算开始时,需要初始化攻防博弈树。
2.非完全信息多阶段动态博弈逆向归纳法
该计算方法,与完全信息多阶段动态博弈逆向归纳法的计算方式大致相同,是在完全信息状态无法满足时,演变而来的计算方法。该算法可以看成一个静态博弈过程,是在逆向归纳过程中,将所有信息节点集合组成一个子博弈树的过程。该算法中,当处于零和博弈状态时,计算相对复杂,为提高效率,需要博弈树中体现最少的非单节点信息集。
四、结语
传统的博弈网络安全防御技术普遍使用的是静态的博弈,这种静态的博弈方式对于网络攻击者的供给意图和攻击策略无法实时的做出合理的应对,防御方式显得过于程式化,无法抵挡多变的网络攻击。因此,非合作动态博弈的网络安全主动防御技术就应运而生了。网络攻防图和攻防博弈树的形成,对于网络动态博弈的主动防御有着深刻的意义,不仅可以提高网络安全主动防御技术的水平,还可以促进网络安全防御技术的改革与创新,以期为网络安全防御领域做出贡献。
参考文献:
[1]林旺群,王慧,刘家红,等.基于非合作动态博弈的网络安全主动防御技术研究[J].计算机研究与发展,2011.
[2]尹红.网络攻击与防御技术研究[J].计算机安全,2009
[3]王纯子,黄光球.基于不完全信息动态博弈的网络攻防态势感知[J].计算机工程,2010.
团队冲突的非合作博弈分析 第4篇
随着工作的复杂化,很多工作仅凭个人努力已经无法完成,因此,各类组织、群体、团队等不断涌现并发展。团队作为一种特殊群体,日益成为一种非常重要的组织形式。但是,团队是由两个或两个以上的人组成的特殊群体,由于成员的个体差异,以及沟通障碍等因素的存在,团队冲突在所难免。团队成员需要正确对待团队冲突,建设性的团队冲突一般对团队是有益的,能够促进团队成员加强沟通,从而提高团队工作绩效。可是对于破坏性团队冲突,则需要团队成员采取一定的措施加以控制。团队冲突频繁而影响团队运作的团队不是优秀团队,但是完全缺乏冲突的团队也不一定是最好的,缺乏冲突的团队容易陷入群体思维模式的陷阱里,不利于团队创新。所以团队需要保证一定冲突的存在,团队管理者需要有效处理团队冲突,控制破坏性冲突,同时利用建设性冲突以促进团队创新、提高决策质量、激励团队进步[1]。要想有效利用团队冲突来提升团队绩效,就必须了解团队冲突的性质与发展,所以认识和分析团队冲突,并采取适当且有效的措施来管理团队冲突就成为团队运行的关键所在。本文基于理性经济人假设,利用非合作博弈模型分析团队冲突,并提出一些具体建议。
1 团队冲突理论的发展与团队冲突特性
1.1 团队冲突理论的发展
团队冲突是一个不断发展的过程。早期(19世纪末20世纪40年代中期)对团队冲突的认识是片面的[2],帕森斯等认为团队冲突都是破坏性的,应该采取一切措施遏制[3,4,5,6]。当时的研究认为只要是冲突就会影响团队绩效和团队目标的实现,因此团队要绝对避免冲突的发生,即使已经产生,也要采取一切措施抑制其进一步发展。
通过不断的研究与探索,团队冲突理论进入了一个新时期(20世纪40年代20世纪70年代)[2],研究学者对团队冲突的认识不再停留在单一维度的思想上,而是认为团队冲突具有双重性,因此出现了团队冲突的二维度分析[1,3,6,7]。这一时期,学者认为团队冲突并不都是破坏性的,有些冲突有利于团队成员的沟通,称之为建设性冲突,例如,当团队成员对团队目标的实现方法有不同看法时,由于成员坚持自己的观点,所以冲突在所难免,可是此时的冲突并不会影响团队目标的实现,相反,团队成员表达出自己的观点,一方面有利于团队成员加强沟通,促进成员间的协同合作,另一方面有利于团队管理者分配任务、寻找出更合适的团队目标实现途径,从而提高团队绩效。所以保证适度的建设性团队冲突存在是必要的。
虽然这一时期的研究相对于早期而言已经较为成熟[2],但仍不全面,经过学者的进一步研究,出现了一种更新的观点(1944年杰恩将团队冲突划分为任务冲突、过程冲突、关系冲突)[8],即认为团队冲突存在不同层次和类型,主要有关系冲突、任务冲突和过程冲突。
(1)关系冲突,是由于人际关系不协调而导致团队成员间的矛盾。关系冲突发生时,团队成员会相互漠视,此时团队成员都不沟通,自己觉得被孤立,一般情况下会影响团队工作绩效。因此关系冲突一般是破坏性的,需要采取一定措施遏制,即使已经发生,也应尽量化解。
(2)任务冲突,是由于团队成员对团队任务有不同观点而产生的冲突。任务冲突会突显成员对团队任务的不同看法,有利于激发团队成员了解其他成员的思想、加强沟通,利于团队目标的实现,但是,任务冲突如果没有很好地被利用,将很有可能发展成为关系冲突而影响团队绩效和团队目标的实现。因此,对于任务型团队冲突需要尤其注意,引导其向建设性方向发展。
(3)过程冲突,是在团队目标实现过程中,由于完成任务产生的争论和团队成员间责、权、利等安排不当而产生的冲突。过程型团队冲突发生在目标实现过程中,因此团队管理者需要时刻关注团队的活动过程,并合理分配全、责、利等,避免不必要冲突的发生[9]。
1.2 团队冲突的特性
从团队冲突理论的发展中,可以看出团队冲突的特性。
首先,团队冲突具有两面性。团队冲突既有建设性的一面,又有破坏性的一面。适当的团队冲突能够促进成员沟通、磨合,加强成员协同合作关系,有利于团队管理者提高决策质量,确定合适的方法实现团队目标,这样的冲突是建设性的;可是一旦团队冲突发展过度,就会对团队目标的实现起到阻碍作用,过度的团队冲突会激化成员间的内部矛盾,减弱团队凝聚力,影响团队绩效,妨碍团队任务的完成,这样的冲突具有破坏性。
其次,团队冲突具有模糊性。团队冲突的性质不总是那么确定,并不是所有的团队冲突不是建设性就是破坏性的,比如有些任务型团队冲突可以被团队成员加以利用,成为对团队有益的建设性冲突,也可能没有被很好地利用而发展成为对团队绩效有消极影响的破坏性冲突,所以有些团队冲突并不能明确界定是建设性还是破坏性的。
最后,团队冲突具有过程性。团队冲突往往并不是在团队刚成立就存在,也不是团队冲突从产生到团队任务完成始终不变,团队冲突有一个发展过程。在一个团队中,早期的冲突并不明显,性质也不恶劣,可是当团队冲突发展到中期,出现责、权、利等冲突时,冲突就会呈现严重甚至恶劣的趋势。随着团队任务的完成,团队成员间又明确了共同方向,此时团队成员由竞争转向合作。团队冲突的这种过程性有利于团队成员在不同阶段采取不同措施对团队冲突加以利用。
2 团队冲突的非合作博弈模型
2.1 合作博弈论与非合作博弈论
博弈论按照博弈双方最终是否达成具有约束力的一致协议,分为合作博弈和非合作博弈。合作博弈就是最终达成了具有约束力的一致协议,是一种利益分配理论,是博弈各方在战略结束以后共同分配所获收益的过程[10]。合作博弈期望通过成员相互合作增加整体利益,从而实现个体利益最大化。合作博弈强调的是团体理性,强调的是效率、公平、公正。非合作博弈研究的是博弈各方在博弈时采取的策略类型,强调的是个体理性、个体决策最优[11]。基于理性经济人假设,冲突双方在利益驱使下会忽略对方利益而选择对自己最优的策略,所以团队利益往往会受到侵害,最终的结果是个体与团队利益均未实现最大化。
合作博弈论与非合作博弈论最主要的区别在于博弈双方最终是否达成具有约束力的一致协议。由于团队冲突成员在理性经济人假设下,都会为了实现自身利益最大化而不顾对方利益,又由于博弈双方无法协商,所以冲突双方在自身利益的驱使下不能达成具有约束力的一致协议,因此冲突双方展开非合作博弈。
2.2 团队冲突的非合作博弈分析
2.2.1 团队冲突成员的博弈方式团队冲突对团队发展有非常重要的影响,无论是建设性还是破坏性团队冲突对团队目标的实现都会产生一定影响,团队成员在发生冲突时会以博弈论理论为基础实现自身利益最大化。博弈论在不同角度有不同分类。首先,按照参与人行动的先后顺序,可分为静态博弈和动态博弈,即博弈双方是否同时做出选择或虽非同时但后行动者是否知道先行动者的策略;其次,按照参与人对其他参与人的了解程度,可分为完全信息博弈和不完全信息博弈,即博弈双方是否准确掌握对方信息;最后,按照参与人之间是否合作,博弈论又有合作博弈与非合作博弈之分[12]。团队成员在发生冲突时会根据实际情况选择合适的博弈方式。
团队成员发生冲突时会为了自身利益而不考虑对方利益,甚至忽视团队利益,这种情况下的博弈双方无法达成具有约束力的一致协议,也就是说冲突双方展开非合作博弈。本文对团队冲突的分析主要借用的工具是非合作博弈,并基于以下5个前提假设建立模型:
(1)双人博弈,即发生冲突的团队成员甲、乙相互博弈。
(2)理性经济人假设,即博弈双方都是理性的,不会因私人感情因素而影响最优策略。
(3)博弈双方无法直接通过沟通协调进行意见交换。
(4)博弈双方不能确定对方将采取何种策略。
(5)静态博弈,即博弈双方同时做出决策,且只选择一次策略类型[13]。
发生冲突的团队成员间的博弈方式类似于囚徒困境。在囚徒困境中,博弈双方都选择背叛策略,双方的利益都受到侵害。在发生团队冲突时,团队成员会考虑自身利益而忽略对方利益并与对方展开非合作博弈。这里对团队冲突的分析以双人博弈为例,假设团队成员甲、乙发生冲突,且甲、乙都是理性的,他们通过选择适当的策略,实现自身利益最大化。
2.2.2 团队冲突的非合作博弈模型假设博弈双方甲、乙成员都只有两种策略类型背叛和合作,博弈双方不同策略类型得到不同的效益矩阵,见表1所示。
其中w、w′分别表示甲、乙都选择背叛或合作所获得的收益,且w< w';b表示被对方背叛所失去的收益,a表示背叛对方所获得的额外收益,且w+a< w′。其中a,b,w,w′ >0。
假设甲以概率p选择背叛,概率(1-p)选择合作;乙以概率q选择背叛,概率(1-q)选择合作,其中 p,q>0,则甲的预期收益Q甲为:
Q甲=p[qw+(1-q)(w+a)]+(1-p)[q(w-b)+(1-q)w′]
=pqw+p(1-q)(w+a)+(1-p)q(w-b)+(1-p)(1-q)w′
∂Q甲/∂p=qw+(1-q)(w+a)-q(w-b)+(1-q)w′
=qw′-qw+qb-qa+w-w′+a
令 ∂Q甲/∂p=0⇒q*=(w′-w-a)/(w′-w-a+b)当q<q*时,甲会选择合作策略。
由于q<q*时甲会才选择合作,当b很大时,q*趋于0, q<q*的概率很小,所以甲会选择背叛乙。此时如果减小被对方背叛所失去的收益b,就会增大q*,当b小到一定程度时,q<q*的概率较大,即甲认为乙会选择合作,所以甲为了实现自身利益最大化而选择合作策略。
同理可知,乙的预期收益Q乙为:
Q乙= q[pw+(1-p)(w+a)]+(1-q)[p(w-b)+(1-p)w′]
所以: ∂Q乙/∂q=qw+(1-q)(w+a)-q(w-b)+(1-q)w′
∂Q乙/∂q=0⇒p*=(w′-w-a)/(w′-w-a+b)当 p<p*时,乙会选择合作。同理可知减小被对方背叛所失去的收益b时,会提高乙与甲合作的概率。由以上可知,当b足够小时,甲、乙双方都会为了实现自身利益最大化而选择合作策略,此时整体利益为2w′,实现了团队利益最大化。
由上述模型分析可知,当被对方背叛所失去的收益b很大时,甲、乙都会认为对方会背叛自己,同时自己也会采取背叛策略。在这种策略类型下,整体利益为2w,显然2w<2w′。若两个人中一方合作一方背叛,则整体利益为2w+a-b<2w′,所以甲、乙背叛的策略会损害团队利益。为了能够避免这种结果,可以减小b,当b足够小时,甲、乙双方选择合作的概率就会足够大,就会实现团队利益最大化。
3 团队冲突的化解方法
在社会分工化越来越细的今天,很多工作都离不开团队成员的相互合作,但是,团队冲突又在所难免,有些团队冲突会影响团队绩效,所以化解损害团队绩效的冲突就显得尤为重要。基于对文章的分析,下面列出四点团队冲突的化解措施:
(1)减小被对方背叛所失去的收益b。由团队冲突的非合作博弈模型可知,p*=q* =(w′-w-a)/(w′-w-a+b)。当q<q*时,甲会选择与乙合作;当p<p*时,乙会选择与甲合作。所以减小b,可以有效增大p*和q*,那么q<q*和p<p*的概率就会增大,即博弈双方选择合作的概率增大;当b足够小时,博弈双方选择合作的概率就非常大。博弈双方合作不仅可以实现个体利益最大化,而且整体利益由原来背叛策略下的2w增加到2w′。所以当团队冲突出现时,团队管理者可以减小被对方背叛所失去的收益b,从而有效利用团队冲突,提高团队利益,促进团队进步。
(2)增大双方合作所获得的收益w′。有上述模型可知,p*=q* =(w′-w-a)/(w′-w-a+b)=1-b/(w′-w-a+b),当适当增大双方合作所获得的收益w′时,可以有效增大p*和q*,那么q<q*和p<p*的概率就会增大,即博弈双方选择合作的概率增大,从而实现个体利益最大化和团队利益最大化。
(3)减小双方都选择背叛所获得的收益w。由式(2)可知,p*=q* =(w′-w-a)/(w′-w-a+b)=1-b/(w′-w-a+b) ,当减小w时,可以增大p*和q*,所以q<q*和p<p*的概率增大,即博弈双方合作的概率增大,可以提高团队绩效。
(4)减小背叛对方所获得的额外收益a。由于p*=q* =(w′-w-a)/(w′-w-a+b)=1-b/(w′-w-a+b) ,当增大a时,能够增大p*和q*,增大博弈双方合作的概率,有利于提高团队利益。
4 结论
适当的团队冲突具有建设性,有利于刺激团队创新、提高团队决策质量、激励团队进步。对于建设性团队冲突,团队成员要充分利用,提高团队利益。不适当的团队冲突对团队目标的实现则具有消极影响。不适当的团队冲突包括过低的团队冲突和过度的团队冲突。过低的团队冲突不利于团队创新,会使团队停滞不前;而过度的团队冲突又会妨碍团队目标的实现。过低的团队冲突和过度的团队冲突都具有破坏性。对于过低的团队冲突,团队应该采取适当的措施刺激其发展;而对于过度的团队冲突,则需要团队成员采取措施抑制其进一步发展,尽量减少对团队产生消极影响[2]。
摘要:由于团队成员间种种差异,以及团队沟通障碍等因素的存在,团队冲突很难避免。有些团队冲突可能会影响团队绩效,甚至妨碍团队目标的实现,所以认识和研究团队冲突并找出适当的解决措施非常重要。基于理性经济人假设,利用非合作博弈模型分析团队冲突,并寻求团队冲突的化解措施是关键所在。
非合作博弈 第5篇
基于战略的供应链管理的合作博弈分析
在供应链管理下,大量的重复博弈及有效的信息沟通,使得供应链管理的合作机制得以实现且具有可持续性.
作 者:高艳娟 GAO Yan-juan 作者单位:哈尔滨工业大学管理学院,黑龙江,哈尔滨,150001 刊 名:西华大学学报(哲学社会科学版) 英文刊名:JOURNAL OF XIHUA UNIVERSITY (PHILOSOPHY & SOCIAL SCIENCES) 年,卷(期):2004 23(2) 分类号:F27 关键词:供应链管理 合作博弈 合作机制 帕累托改进 企业战略
非合作博弈 第6篇
“僵尸终端”与“海盗终端”
林子大了什么鸟都有。
市场大了什么店都有。
有这样两类终端店:
一类对市场变化和同行竞争反应较为迟钝,应对不及时,甚至缺乏应对,促销不活跃,营销手段陈旧,营销模式单一,屡遭败绩仍安之若素。这类终端,其步调僵硬有如僵尸,总是一条道走到黑,撞了南墙也不回头。
“僵尸终端”的最大死穴在于迟钝。
市场早已进入快鱼吃慢鱼的营销时代!“僵尸终端”因为无法跟上市场变化,被淘汰几乎是宿命。
但是,放眼市场的各个角落,仍然可以见到少数“僵尸终端”呆滞的身影,个中缘由:一是市场发展不平衡,个别“僵尸店”得以在竞争的缝隙中勉强生存;二是店主具备某种资源优势(如自家商铺没有租金压力、掌握上游采购资源可以低价进货等),使之得以冲减竞争压力;三是正在被淘汰的路上苟延残喘。
另一类终端则与“僵尸店”判然不同。
它们市场反应迅速,促销积极,但往往只注重营销的短期效应和促销的即期业绩,没有整体、长远的发展规划,虽然聚客快,但忠诚度低,顾客流失也快。就像海盗一样身手敏捷,同时掠夺性强,霸气外露,对竞争者咄咄逼人,对顾客则急功近利,涸泽而渔。
这类“海盗终端”,短期内的生存不成问题,但发展远景同样堪虞。
譬如近两年,一些日化店开始盛行由包场促销演变而来的封柜促销:在促销期内主打一个品牌,该品牌全面占据店内陈列位、宣传位,其他品牌不是被挤到了犄角旮旯,就是被临时下架。再集中配合海报、横幅、宣传单等,形成该品牌“包场”的效果,从而达到短期内快速冲量的促销目的。
由于日化店并非某个单一品牌的专卖店,这个月完成了A品牌的任务,下个月又得考虑如何让B品牌上量。为了平衡,店主只好在这家品牌“封柜”后,又赶紧做那家品牌的“封柜”,形成“你方唱罢我登场”的轮包模式。
这种长期的、排他性的单品牌促销,既削弱了门店的价值,也压抑了顾客需求甚至剥夺了顾客的选择权。你能封闭自己的店,你不能封闭竞争对手的店;你不给顾客选择品牌的自由,顾客就要行使选择店铺的自由。
你想掠夺式透支顾客资源,最终还是门店伤不起。
当“僵尸”遇上“海盗”
长沙市的商业街上,就有一家“僵尸型”日化店,前店后院式,外面商铺卖产品,二楼摆放三张床做售后美容服务。
之所以把它归类于“僵尸店”,是因为这家店既无特点,又无High点。为了省电,即使下午光线不足,店内也不开灯。除了店务管理落后,促销活动更是乏善可陈,店主对促销的理解还停留在“厂家给我们什么,我们就送顾客什么”的原始阶段,没有主动策划系统促销的意识,更没有促销宣传和整店包装的意识。
店主自认为,这条街流动顾客少,周边社区居民是主要客源,所以主要靠做客情,只要抓住回头客就可以高枕无忧了。殊不知,其单调老套的服务、一成不变的形象和促销,究竟能对顾客产生几分吸引力?
打破表面平静的,是这条街上新开的一家同属前店后院式的“海盗店”。
店主野心勃勃,意图迅速抢占市场,站稳脚跟,于是开业之初便进行大力度促销,几乎每月一大促、每周一小促,逢重大节日,场外大促更是必不可少,搭舞台、流动派单、宣传车巡游、关联销售、业绩奖励……全面出击果然带旺了人气,其中相当一部分都是“僵尸店”的老顾客。
“僵尸店”的店主原以为自己有稳定客群,别人做活动对其影响不大,所以对竞争对手的进攻漠然视之。谁知几个月下来,便发现顾客流失严重,业绩渐形惨淡。店主难免有些着急,思来想去,只好利用现有的后院服务,推出免费洗面来聚客、吸客,同时延续以往厂家有啥我送啥的促销手法,在店内做做常规的买赠。只可惜这些招数怎能抵挡得了对手的“八卦连环掌”!
而新店店主见对手如此应对乏力,仿佛吃了定心丸,心里甭提有多乐。
歪打正着的胜负大逆转
然而时间不久,双方业绩却发生了戏剧性的变化——“海盗店”业绩逐月下跌,屡试不爽的促销变得不灵光了;而徘徊在生死线上的“僵尸店”,业绩却稳步回升,一路飘红。
奥妙何在?
原来,“海盗店”虽然营销节奏快、促销手法新,但每一轮促销都陷入了一味追求高销量,片面追高客单价的误区,只有即期业绩考核,而无远期营销规划。更由于大奖额的内部销售擂台赛的刺激,店员的推销积极性达到了狂热状态。为了争夺日冠军、周冠军、场冠军,关联销售蜕变为强销、硬销,顾客满意度大大降低,尤其后院服务的强销给顾客带来明显心理压力。
于是,数月后,经过“海盗店”的多轮促销、促销透支,顾客进店率一路下滑,生意日渐萧条。
再看“僵尸店”,反而因消费者进店没有心理负担,购买自主性强,赢得老顾客大量回流,新顾客也陆续进来,业绩明显好转。
“僵尸终端”本来是没有竞争力的,但遇上了“海盗终端”,却歪打正着反而拥有了独特的竞争力。
这给我们带来什么启示呢?
启示一:营销也像刘翔跨栏,用力过猛就有可能受伤摔倒。所以,过度促销、过度作为,最后反而败给了源于“迟钝”的无为而治。
启示二:营销是一种动态博弈,成与败离不开对具体营销环境的适应。没有放诸四海而皆准的绝对策略,能够适应环境的,能够克敌之短的,就是最佳策略,因此营销切忌“一窝蜂”。
在“海盗店”新张之初,消费者的优势需求是新鲜感与实惠感,“海盗店”满足了消费者的这一优势需求,因而在前期大有斩获;而在“海盗店”的连番促销轰炸后,消费需求却悄然发生了改变,这时的优势需求不再是求新鲜、图实惠,而是追求购物的安全感和轻松感,于是,此时“僵尸店”得以反败为胜。
非合作博弈 第7篇
关键词:非合作博弈联盟,冷链物流,Shapley
0 引言
目前由于国内农业产业调整和国民的消费水平提高, 我国既面对生鲜农产品和农产品“南北互通”的流通量逐渐增大, 又要应对农产品的品质和安全, 而发展农产品冷链物流有助于解决这些状况。国内目前农产品存在的冷链物流模式主要分为两大类;一是以大型批发综合市场为主体的非合作博弈联盟;二是以大型超市或加工厂为主体的合作博弈联盟。由于我国国情和经济水平不一特点, 目前大部分农产品是以非合作博弈的形式进行流通, 经过调查发现, 在非合作博弈下, 农产品进行冷链流通的比例是比较低的, 原因是多方面的, 如收益不均降低冷链实施意愿, 这正是本文撰写的目的:探讨非合作博弈农产品冷链物流联盟成员收益分配。
1 非合作博弈农产品冷链物流
农产品冷链物流是指使肉、禽、水产、蔬菜、水果、蛋等生鲜农产品从产地采收 (或屠宰、捕捞) 后, 在产品加工、贮藏、运输、分销、零售等环节始终处于适宜的低温控制环境下, 最大程度地保证产品品质和质量安全、减少损耗、防止污染的特殊供应链系统。
非合作博弈是指参与者通过未有约束力性质的松散联盟, 实现个人利益最大1化的博弈类型。
以大型批发综合市场为主体的非合作博弈联盟是以农户 (或生产基地) 、经销商 (批发商) , 综合市场、分销商和消费者组成的一个松散, 无强制约束的农产品冷链物流联盟, 流程图如图1所示:其特点如下: (1) 个人利益置于集体利益之上, 联盟成员是从各自利益出发的理性人; (2) 联盟成员虽有分工, 但地位平等; (3) 联盟各成员获得收益与付出常常不匹配; (4) 竞争激烈, 缺乏农产品冷链物流统一规范化文件和标准。
在非合作博弈农产品冷链中, 一方面经销商与分销商承担了整个冷链的运输, 但是由于规模实力小, 实施冷链成本大, 造成即便是实施冷链也经常会出现“断链”的情况出现;另一方面联盟各成员通过自己的劳动, 经过各自认为产品增值后, 即对产品进行销售来获得收益。
2 模型假设
考虑一个单一的农户 (Farmer) 、经销商 (Dealer) 、分销商 (Retailer) 、消费者构成的农产品冷链上的非合作博弈。F、D、R分别表示农户、经销商和分销商;表示特征收益函数。经销商从各地农户收集农产品并对其进行冷链运输, 分销商在农产品批发综合市场从经销商手里获得农产品, 并最终出售给消费者。
模型假设如下:假设农产品生产的成本为Cm, 经销商向农户的收购价格为λ1P, 分销商从经销商处获得农产品的批发价格为λ2P, λ1, λ2是基于对相应农产品自身认知博弈后获得的价格系数, 且 (0<λ1<λ2<1) , 分销商最终以价格P出售给消费者。消费者对产品的需求特性曲线为Z (P) =α-βP, α, β为常量且α, β>0, α为市场容量, β为消费者对价格的忍受程度。
3 模型构建
模型构建是为确定各成员、经销商和分销商的特征收益函数, 在非合作博弈联盟中, 农产品批发综合市场在冷链中起的作用主要信息传递, 交易场所提供和协调冷链正常运行。各联盟成员在信息互不对称的前提下, 以非合作博弈的形式结盟追求各自的利益最大化。即各自收益最大函数为:max V (F) = (α-βP) (λ1P-Cm)(1)
在该模式下, 各特征收益函数对求导, 可求出在非合作博弈情形下期望的最大收益, 以及相应的价格农产品P有
从 (4) , (5) , (6) 式子可以看出: (1) 农户其所获收益处于整个冷链的最弱势地位, 因收购价格由λ1, Cm所确定, λ1变化取决于农户对于市场信息的不确定, Cm取决自身对于农产品成本的控制;在V (F) 中可以看出, 农户对于农产品信息获得越完整, 生产农产品成本越低, 其在博弈中能获得更多的收益。 (2) 经销商作为冷链承运的主体, 能把偏远地区的农户与靠近市场的分销商联结起来, 这使得经销商在获取收益需要双重博弈, 即与农户和经销商之间博弈, 来扩大λ2-λ1的差值来获得收益;同时经销商与分销商由于贴近市场, 所以其获得的收益是取决于市场容量与消费者的态度, 而与收购价格无关, 如旱涝时期, 由于消费者对蔬菜消费需求不变, 即便蔬菜价格上涨, 但生产成本升高, 造成菜农收益降低, 而经销商和分销商却不受影响依然获得相应收益。 (3) 分销商博弈处于冷链的最末端, 参与的冷链短, 对于收益能搞较好的控制, 即便是在与经销商博弈受损, 也能在通过与消费者接触博弈中获益。
4 Shapley模型证明
Shapley是Shapley教授于1953年提出的用于解决多人对策博弈理论中一种数学方法, 该方法认为多人进行非对抗性合作所获得的整体收益应增加, 实现了联盟总体利益在各成员之间的公平和有效的分配。
设集合I={1, 2, …, n}, 如果对于I的任一子集都对应着一个实值函数v (s) , 满足:
从 (7) , (8) 式中可知, 通过合作博弈所带来的收益应大于各联盟成员的收益之和。
如果农户、经销商和分销商、消费者通过合作其所获得的最大收益为:max V (F, D, R) = (α-βP) (P-Cm) (9)
通过对价格P求导有:
βC根据约束条件有, λ1-1<0, 所以, 即
(12) 式说明, 农户、经销商和分销商如果以合作的方式来获得最大利益, 反而降低了该模型的整理收益, 即说明农户、经销商和分销商是根据市场的需要, 组成无约束或简单约束的松散非合作农产品冷链物流联盟, 在该联盟中联盟成员决策主要依据个人行为进行确定决策行为, 与联盟内其他成员无关, 并期望实现个人利益最大化, 最终所得收益依据纳什均衡来进行调整。
5 总结
文章提炼归纳非合作博弈农产品冷链物流联盟模式, 并通过构建模型来分析计算农户, 经销商和分销商三者的最大期望收益, 用Shapley分析并得出农户、经销商和分销商三者之间是以非合作的形式来组建联盟, 并非是为了提高这个冷链的整体收益。
参考文献
[1]郑鑫, 等.基于Shapley值法的三级闭环供应链收益分配模型[J].运筹与管理, 2011, 20 (4) .
[2]郭家德.农产品冷链物流模式及对策研究[D].武汉理工大学.
非合作博弈 第8篇
以汽车、飞机、航空发动机、船舶等为代表的
离散制造业在其零件生产过程中具有工艺复杂、品种多、批量小、批次多、难度大、特种工艺多的特点,大多采用在一定时间内,同一条生产线上生产多种不同型号、不同数量产品的多品种混流生产的生产组织模式[1],为此,生产线中设备大都需要承担不同种类零件的生产任务。在生产线中往往以设备利用率作为对设备服役过程的考核指标,每台设备在生产过程中,都希望有较高的设备利用率,因此,在生产过程中不同设备之间存在对制造任务的竞争关系。设备与任务之间的关系就是制造资源的配置问题。传统的资源优化配置主要从任务调度方面进行研究,以车间或者单元为研究对象,实现制造任务向车间或者单元的生产设备分配[2,3,4,5,6]。这样的资源配置方法忽略了生产设备之间存在的追求任务负载的竞争关系,从而不能保证设备的利用率获得最大程度的提高,最终导致资源浪费。
为此,在本文中把每台设备作为决策主体来描述它们在生产过程中的相互竞争关系,在制造过程中,以每台生产设备的利用率为收益函数,建立制造资源配置的非合作博弈模型,并通过对局中人的模糊聚类实现对模型的求解,进而实现制造资源的优化配置。
1 设备配置过程的形式化描述
本文所研究的是将制造任务加载到具体生产设备的过程,为此,首先进行如下假设:①在同一时间,一台设备只能完成一个零件一道工序的生产任务;②所有的生产设备有相同的机会竞争加工任务。
设备配置过程中涉及的主要元素包括制造工艺、生产设备等,它们可以形式化描述如下:
(1)生产设备E={Ei,i=1,2,,n},表示生产线中的n个生产设备。
(2)可用时间Ta={Ta,i,i=1,2,,n},表示生产设备能够用于生产的时间。
(3)制造工艺Pr={Pr,i j,i=1,2,,m;j=1,2,,Ni},其中,i为零件的序号,j为零件Pi的工序号,Ni为工艺路线所包含的工序数,Pr,i j表示零件Pi的第j道工序。此外,Pi的第j道工序的工时可以表示为Ti j。
(4)任务负载L={Li,i=1,2,,n},表示在制造任务加载到生产设备之后,其所承担的工序对应工时的总和。
(5)设备利用率U={Ui,i=1,2,,n},表示生产设备的利用率,等于任务负载与可用时间的比值,即
2 制造资源优化配置非合作博弈数学模型
2.1博弈论与非合作博弈
博弈论是研究决策问题及均衡问题的理论。非合作博弈是指所有局中人选择各自策略以求得自身利益最大化的过程。规范型的非合作博弈问题包括三个要素:局中人(player),策略集 (strategy),收益函数(payoff)[7]。
2.2制造资源配置的非合作博弈模型
在本文的制造资源配置的非合作博弈过程中,参与制造的生产设备映射为博弈模型中的局中人,与生产设备相关的制造任务工序映射为策略集,将生产设备的利用率作为局中人的收益函数,通过求解该模型的Nash均衡[7],就可完成制造资源的优化配置,提高设备利用率,促进设备之间的负载均衡,降低设备运行成本,使得任务负载和资源配置更趋合理。
针对上述资源配置模型,引入博弈论,那么制造资源配置的非合作博弈模型可以用如下三元组进行描述:
G=(E,Si,Ui) (1)
上式的变量描述如下:
(1)假设有n台可用设备,局中人为E={E1,E2,,En}。
(2)Si为局中人Ei的策略集,即设备可承担的可选任务。生产线中所有设备局中人的可选任务集为S{Si(Pr,i,Ti)},i=1,2,,n。假设局中人Ei的策略集Si包括k个策略,则Si={(Pr,i j,Ti j)},i=1,2,,n;j=1,2,,k。
(3)Ui为设备局中人的收益函数,即为生产设备的利用率。
3 基于模糊聚类的博弈模型求解方法
寻找博弈论的解是博弈论的核心内容,针对多个局中人博弈模型的问题,本文引入模糊聚类理论对局中人进行聚类分析[8,9],把多个局中人分为两组,将多人博弈的模型转化为两人博弈模型,从而降低博弈求解的难度。
3.1博弈局中人的模糊聚类方法
模糊聚类分析应用模糊数学方法进行聚类分析,因此模糊聚类分析可以将各个样本以不同的隶属度划分到各个类别,即将样本对各个类的隶属度扩展到区间[0,1],以数字定量地确定样品的“亲疏关系”,从而将样品进行分类划分[10]。
本文采用模糊等价关系的聚类分析,将不同的博弈局中人进行归属分类。在聚类分析之前,需要明确局中人之间的关系,可以引申为模糊数学的模糊关系。数学上用“关系”来描述事物之间的联系,在模糊数学中用集合的形式来表示“关系”。如果不仅仅只有两种事物,那么每两种事物将会构成一个模糊关系集合,所有模糊关系的集合构成一个模糊关系矩阵R=(ri j)nn。模糊关系矩阵可以描述设备局中人策略空间的相似程度,便于归属分类,从而简化博弈模型求解。通常情况下计算得到的模糊矩阵满足自反性及对称性,但是不满足传递性。为了能够对设备局中人进行归属分类,需要对模糊矩阵进行合成运算,使模糊矩阵满足模糊关系矩阵性质。
根据非合作博弈模型,基于模糊聚类分析对设备局中人进行聚类,完成策略空间的归属。模糊聚类分析的过程首先是建立模糊聚类分析的样本,通过消除样本的量纲把样本的隶属度控制在[0,1]区间之内,最后建立模糊相似矩阵,并对模糊相似矩阵进行合成运算,求得其传递矩阵,最后根据传递矩阵来归属聚类。
在整个聚类过程中,建立模糊相似矩阵的方法有很多种,常用的有:夹角余弦法、相关系数法、最大最小法、数量积法、算术平均最小法、几何平均最小法、绝对值指数法、绝对值倒数法、绝对值减法等。根据设备局中人的特点,这里选择绝对值减法来建立模糊相似矩阵,具体实现步骤如下:
(1)模糊聚类分析的初始样本表征的是设备局中人在其策略空间中描述加工每道可选加工工序的利用率,可以使设备局中人能够“理性地”争取自身利用率最大的工序,避免承担自身利用率较低的工序。通过建立初始样本,可以使得设备局中人一开始就谋求自身利用率最大化,同时也便于具有相似策略空间的设备局中人的聚类归属。此外,根据初始样本的特征,可以把样本的隶属度控制在[0,1]区间内,便于构建模糊相似矩阵。
(2)由于建立的样本隶属度在[0,1]区间内,因此不需要再进行标准差变换及极差变换来消除量纲对模糊相似矩阵的影响。为此,首先对每一台生产设备Ei用每道工序在该设备能够消耗的工时来表征,即(xi1, xi2,,xi M),其中M是所有零件所包含工序数量的总和,即
式中,C为适当选取的系数,使0ri j1。
(3)将标定所得的模糊矩阵R改造成模糊等价矩阵R*,即使得R满足模糊关系矩阵的性质。常用平方法求得R的传递闭包,依次计算R2,R4,R8,,R2i,当满足R*=R*R*时,R*即为R的传递闭包矩阵。
(4)对传递闭包矩阵R*,取模糊分类隶属度λ由大变小,即从1到0,可以把不同的设备局中人进行归属分类,形成动态聚类图,从而减少局中人的策略归属空间,简化博弈模型求解。
3.2博弈模型纳什均衡最优解
对于局中人Ei的策略si和s′i,当且仅当ui(si,s-i)>u(s′i,s′-i)对于任意s-i∈S-i都成立时,称前者对于后者是严格优势的。如果ui(si,s-i)≥u(s′i,s′-i),且至少有一个s-i使不等式严格成立时,则称纯策略si为弱优势。一般地,博弈论中将除了某个给定的局中人之外的所有局中人标记为“-i”。
在博弈过程中,局中人通过竞争与合作,最终会达到利益均衡,那么这个均衡就是博弈论的解。1950年约翰纳什(John Nash)定义了非合作博弈模型及其均衡解。这个均衡理论被称为纳什均衡(Nash Equilibrium)。纳什均衡可以用数学的方式描述如下:
ui(s*i,s*-i)≥ui(si,s*-i) s-i∈S-i (3)
纳什均衡实际上是一组所有局中人策略的组合,它使得每个局中人的策略都是对其他局中人策略的最优反应,即任何一个局中人单独偏离纳什均衡,其自身收益不会因此而变大;相反,如果存在这么一种均衡不是纳什均衡,即不是所有参与者的最优策略组合,至少会有一个局中人会改变自己的策略来谋求更好的收益,那么这种均衡不具有“自我约束力”,就不能达到一种稳定而且持久的平衡。
如前所述,在整个博弈的过程中,博弈的结果不仅受到局中人所选策略的影响,还将受到其他局中人策略的影响,即任何一个局中人的收益都取决于所有局中人的策略组合。在某一次博弈过程中,如果某个局中人的某一种策略对于其他策略总是严格优势或者弱优势的,那么该局中人会乐于接受这种策略选择。推广开来,如果某种策略组合对于其他策略组合是严格优势或者弱优势的,那么所有的局中人都将乐于接受这种策略组合,因此是稳定的,即达到了Nash均衡。
对于有限个局中人博弈,Nash均衡并不唯一。对于Nash均衡的多重性问题,一般的解决方法是采用均衡精炼的方法。常用的均衡精炼方法主要有帕累托(Pareto)改进与风险占优两种方法,本文采用的是帕累托改进的方法。即
考虑博弈G=(N,Si,Ui),对于任意给定的两种策略组合s,
4 算例分析
4.1非合作博弈模型实例
为了验证资源优化配置非合作博弈模型的有效性及可行性,以拥有8台设备,承担7种不同零件生产任务的生产线为实例进行验证计算。
表1中给出了设备可承担的工序集合。从表中可以看出设备E2可以承担的工序集合可以表示为{Pr,11,Pr,15,Pr,24,Pr,33,Pr,41,Pr,45,Pr,47,Pr,56,Pr,62,Pr,71,Pr,73},此外,每道工序在对应设备上的工时在圆括号中给出。例如工序Pr,11在E2上的工时为7.2h。表1中给出的工序集合就是生产设备的博弈策略空间,其策略只能从该策略空间中选择,通过预测他人的策略选择来确定自己的策略,以谋求自身利益最大化,显然,Nash均衡解也必定落在这个工序集合之内。
4.2基于模糊聚类的博弈模型解算
从表1可知,博弈局中人N=8,即为{E1,E2,E3,E4,E5,E6,E7,E8},构成8人的多人博弈模型。这种多人博弈模型中Nash均衡的求解是非常困难的。为此,本文引入模糊聚类算法来对局中人进行聚类分析,以减少局中人的个数,这样可以大大降低博弈模型的求解难度。
首先对每个局中人(设备)Ei用每道工序在该设备能够消耗的工时来表征,即(xi1,xi2,,xiM),例如设备E1的隶属度值为
(0,7.8,0,0,0,0,4.6,0,7.1,0,0,
0,0,0,0,0,0,5.7,0,0,0,0,4.8,
0,5.8,0,0,0,0,0,6,0,0,0,4,6,
0,0,0,0,6.9,0,0,0,0,8.1,0,0,0)
同样对其他设备进行表征,并采用绝对值减法,|C|=0.02,求得模糊相似矩阵为
采用平方法来求布尔矩阵R的传递闭包矩阵:
由于R4=R8,因此矩阵R的传递闭包矩阵t(R)=R4。当λ=0.7时,把8个局中人(设备)分为两组,即P1={E1,E4,E5,E7},P2={E2,E3,E6,E8}。经过归属后,P1、P2的策略空间分别为
{Pr,12,Pr,13,Pr,17,Pr,21,Pr,22,Pr,25,Pr,26,Pr,31,
Pr,34,Pr,35,Pr,37,Pr,42,Pr,43,Pr,44,Pr,51,Pr,53,Pr,55,
Pr,57,Pr,61,Pr,63,Pr,66,Pr,67,Pr,72,Pr,74,Pr,75,Pr,77}
{Pr,11,Pr,14,Pr,15,Pr,16,Pr,23,Pr,24,Pr,25,Pr,27,Pr,32,
Pr,33,Pr,36,Pr,41,Pr,45,Pr,46,Pr47,Pr,51,Pr,52,Pr,54,
Pr,56,Pr,62,Pr,64,Pr,65,Pr,71,Pr,73,Pr,76,Pr,77}
通过对比分析P1与P2的策略空间,把只能由生产设备组P1(P2)加工的工序称为P1(P2)的固有策略,这些固有策略并不因为生产设备组的博弈过程而改变,也不存在固有设备组之间的竞争。由于固有策略的特殊性,需要对其进行特殊的处理。把P1和P2的固有策略提取出来,其中,P1的固定策略为
{Pr,12,Pr,13,Pr,17,Pr,21,Pr,22,Pr,26,Pr,31,Pr,34,
Pr,35,Pr,37,Pr,42,Pr,43,Pr,44,Pr,53,Pr,55,Pr,57,
Pr,61,Pr,63,Pr,66,Pr,67,Pr,72,Pr,74,Pr,75)
P2的固定策略为
{Pr,11,Pr,14,Pr,15,Pr,16,Pr,23,Pr,24,Pr,27,Pr,32,Pr,33,
Pr,36,Pr,41,Pr,45,Pr,46,Pr,47,Pr,52,Pr,54,Pr,56,
Pr,62,Pr,64,Pr,65,Pr,71,Pr,73,Pr,76}
通过划分,博弈模型变为二人博弈。但是存在一个问题,P1及P2的固定策略是由其组员共同承担的,对于具体设备的配置就需要先对P1及P2的固定策略进行博弈解算,同时可以得到生产设备组P1及P2在其固定策略上的设备利用率,才能使P1、P2间的博弈能够进行下去。
对P1的固有策略来说,对其进行模糊聚类分析,求得模糊相似矩阵及其传递闭包矩阵为
同样地,对P2的固有策略进行模糊聚类分析,可以求得其模糊相似矩阵以及传递闭包矩阵,即
博弈的结果是双方相互作用的结果,任何一个局中人改变其策略,双方的收益都会发生变化。需要注意的是,当局中人E1与局中人E4选择的策略中包含相同的工序时,此时双方的利用率收益均为零。根据之前假设的条件及博弈模型的约束可以知道,在实际加工过程中,同一个工序不能同时被两台生产设备加工,同时生产设备并不区分优势弱势,均具有相同的机会申请加工该道工序,因此不能说明发生冲突的工序应该由哪台设备进行加工,由此双方局中人的收益均为零。
4.3Nash均衡的求解
用相同的方法继续对设备组P1和P2的固定策略划分为不同的子博弈模型,计算其利用率收益并对加工工序进行策略归属,可以得到设备局中人的策略空间归属。表2列出了设备组P1和P2固定策略经过博弈后,各设备局中人的策略空间。
在完成了对设备组P1和P2的固定策略的策略归属之后,把它们对应的策略表示为OP1和OP2,再来对设备组P1和P2进行博弈解算。设备组P1和P2的收益矩阵如表3所示。
根据收益矩阵采用基于启发搜索算法[11]其Nash均衡计算过程如图1所示。此时P1选择策略P1(OP1Pr,25Pr,51Pr,77),P2选择策略P2(OP2)。图1显示了P1和P2纯策略Nash均衡帕累托改进的收敛曲线。
为了便于分析问题,把P1和P2的其他纯策略Nash均衡做了隐藏处理。由图1可以看出,博弈双方由于不知道对方会选择什么样的策略,因此一开始均以12.5%的概率来选择8组纯策略进行组合作为本方策略选择,即以混合策略的形式来选择策略。随着博弈活动的进行,P1发现如果选择策略s1P1,P2发现如果选择策略s1P2,那么他们的利用率收益都会变大。但是由表3可以看出,如果双方采取的策略组为(s1P1,s1P2)的话,此时并不稳定,即只要双方任何一个人改变其策略,都会找到更好的收益。策略组(s1P1,s1P2)并不是它们的Nash均衡点,是不具有任何的“自我强制性”的。博弈活动继续深入进行,此时局中人P1知道,P2在这次博弈的活动中会一直选择策略s1P2,如果自己不改变策略将会得到较小的收益,因此P1最后放弃了本来能够得到更好收益的策略s1P1,转向采取了收益较差的策略s8P1,最终达到了Nash均衡。由表2及表3可以看出,博弈的结果是局中人双方相互作用的结果,是双方进行竞争而产生的结果,竞争的结果不可能达到双方都是严格优势的均衡解,但是一定是严格弱优势的均衡解。
将P1和P2的策略归属到8台生产设备E1,E2,,E8上来,我们可以得到8台设备局中人进行博弈后最终的策略选择。表4为各局中人E1,E2,,E8的策略选择及其收益。
5 博弈方法与遗传优化算法的比较
为了验证博弈模型及解算结果的正确性及有效性,将本文提出的博弈算法与常用的遗传优化算法(genetic algorithm,GA)、禁忌搜索(tabu search,TS)和粒子群算法(particle swarm optimization,PSO)进行比较分析。遗传算法一般由选择、交叉、变异三种进化算子组成。对于选择算子,采用轮盘赌的方法进行;对于交叉算子,采用单点交叉的方法;对于变异算子,与传统的变异算子相同,有所区别的是变异的规则或者说变异的范围要进行控制。由于加工任务由一系列的加工工序组成,当发生变异时,则在具有相同加工能力的设备间发生变异。由此,在本文的实例中以种群规模为50,交叉概率为80%,变异概率为5%条件下进行遗传运算,在最大迭代次数为2000时进化终止。对于禁忌搜素算法采用禁忌长度为10、候选集长度为15,最大迭代次数为200作为搜索参数。粒子群算法的参数设置为:粒子维数(即设备数)D=8,粒子规模(即粒子数)Xnum=16,加速系数c1=2.2,c2=1.6。将博弈方法与遗传算法、禁忌搜算、粒子群算法的优化结果在表5中进行比较,可以看出博弈方法在优化效果上优于遗传算法。
6 结论
针对制造资源的优化配置问题,引入博弈论描述设备之间在任务负载上的自由竞争关系。以设备最大利用率为收益函数,构建了基于非合作博弈论的资源优化配置数学模型,并根据模糊数学的模糊聚类分析理论提出了求解博弈模型Nash均衡的算法。最后通过实例并与遗传算法、禁忌搜算、粒子群算法进行比较,验证了本文提出的非合作博弈资源优化配置模型及求解方法的有效性和正确性。
摘要:在制造资源配置过程中,针对不同生产设备为了追求任务负载而存在的自由竞争关系,引入博弈论描述设备之间在任务负载上的相互制约关系。提出基于非合作博弈的制造资源优化配置方法,把生产设备映射为非合作博弈制造资源优化配置模型的局中人,建立局中人的策略及其收益函数。利用模糊聚类分析的方法对博弈局中人进行聚类,进行Nash均衡的求解。通过实例与遗传算法、禁忌搜索、粒子群算法进行比较,结果表明基于非合作博弈的制造资源优化配置方法获得的任务负载策略能够保证生产设备总体具有更高的利用率,由此,验证了算法的有效性和正确性。
关键词:任务负载,制造资源配置,非合作博弈,纳什均衡
参考文献
[1]王炳刚,饶运清,邵新宇,等.基于多目标遗传算法的混流加工/装配系统排序问题研究[J].中国机械工程,2009,20(12):1434-1438.Wang Binggang,Rao Yunqing,Shao Xinyu,et al.AMOGA-based Algorithm for Sequencing a Mixed-model Fabrication/Assembly System[J].ChinaMechanical Engineering,2009,20(12):1434-1438.
[2]郑永前,王阳.基于遗传算法的加工工艺决策与排序优化[J].中国机械工程,2012,23(1):59-65.Zheng Yongqian,Wang Yang.Optimization ofProcess Selection and Sequencing Based on GeneticAlgorithm[J].China Mechanical Engineering,2012,23(1):59-65.
[3]Ma G H,Zhang Y F,Nee A Y C.A Simulated An-nealing-based Optimization Algorithm for ProcessPlanning[J].International Journal of Production Re-search,2000,38(2):2671-2687.
[4]潘全科,朱剑英.多工艺路线多资源多目标的作业调度优化[J].中国机械工程,2005,16(20):1821-1826.Pan Quanke,Zhu Jianying.An Optimization Meth-od for a Multi-objective Job-shop SchedulingProblem under Multi-resource Constraints[J].China Mechanical Engineering,2005,16(20):1821-1826.
[5]Wong T N,Leung C W,Mak K L,et al.DynamicShop Floor Scheduling in Multi-agent Manufactur-ing Systems[J].Expert Systems with Applications,2006,31(3):486-494.
[6]Li W D.A Simulated Annealing-based Optimiza-tion Approach for Integrated Process Planning andScheduling[J].International Journal of ComputerIntegrated Manufacturing,2007,20(1):80-95.
[7]侯定丕.博弈论导论[M].合肥:中国科学技术大学出版社,2004.
[8]郑丞,金隼,来新民,等.基于非合作博弈的公差分配优化[J].机械工程学报,2009,45(10):159-165.Zheng Cheng,Jin Sun,Lai Xinmin,et al.ToleranceAllocation Optimization Based on Non-cooperativeGame Analysis[J].Journal of Mechanical Engineer-ing,2009,45(10):159-165.
[9]范周田.模糊矩阵理论与应用[M].北京:科学出版社,2006.
[10]张弢,纪德云.模糊聚类分析法[J].沈阳大学学报,2000,12(2):73-79.Zhang Tao,Ji Deyun.Fuzzy Clustering AnalyticalMethods[J].Journal of Shenyang University,2000,12(2):73-79.
非合作博弈 第9篇
据中国银监会统计, 2014年6月末全国股份制商业银行小微企业贷款余额达32700亿元, 同比增长19.34%, 占银行业全部小微贷款余额的比例达17.13%, 而在浙江地区, 联保互保模式融资占比已超过浙江企业融资比例的40%。联保互保破产之后, 据2012年温州市龙湾区人民法院数据, 从2012年到2013年前8个月, 涉及担保的案件比例分别为96.7%和94.3%。从数据可知, 我国联保互保的规模十分庞大, 而且联保一旦破产, 后果十分严重。
本文将小微企业联保互保风险演化过程分为三个阶段, 并尝试以企业与企业之间、银行与银行之间及企业与银行之间的合作与非合作博弈来分析其选择及后果。
二、演化过程
(一) 前提假设
1. 博弈者:
绩效好、风险低的良性企业A;绩效差、风险高的劣性企业B;银行C、D;均为有限理性者。
2. 信息不对称假定:
银行在给企业进行贷款之前, 由于对求贷企业的财务报表、道德水平及发展前景等信息掌握得不全面, 因此获得的信息存在偏差, 不一定能做出正确的决策。
3. 柠檬市场效应假定:
在信息不对称的情况下, 合格的商品或者企业会遭受淘汰, 而劣等企业会逐渐占领市场, 从而导致市场萎缩恶化。
4. 机会主义行为:
在信息不对称的情况下, 人们不完全如实地披露所有的信息, 一般是用虚假的、空洞的或非真实威胁或承诺谋取个人利益的行为。
(二) 第一阶段:形成阶段
1. 企业与企业之间寻求联保互保的合作博弈。
在担保圈形成之前, A型企业先与B型企业针对银行贷款进行决策。 (1) 若A型企业与A型企业联合, 则形成的联合组织的偿债能力增强、风险降低, 联合将会成立。 (2) 若A型企业与B型企业联合, 对B型组织来说提高了其偿债能力, 同时降低其风险性, B型企业选择参加互保。但是对于A型企业来说, 联合将会降低了其偿债能力, 同时提高其风险性, 因此不会选择参保。
然而, B型企业为了获得贷款, 会把自己掩饰成A型企业, 而真正的A型企业由于信息不对称, 难以判断对方实质, 所以只能根据所得信息判断及自身的需求决策。在考虑联保互保的时候, 企业偏向于看重自身需求, 因此在行业乐观的前提下, 往往忽略联保企业的质量。所以在B型企业的掩饰及行业乐观的麻痹下, 联保互保参与者包括了A型与B型企业。
大多例子证明, 行业在尚未饱和的前期, 确实有充裕的盈利空间, 许多企业在这个时期都是有所获益的。因此, 这个时期的博弈属于合作博弈。
2. 银行与企业之间的合作博弈。
A、B型企业之间形成联合之后, 以“集合信托”的形式向银行寻求更大的贷款利益。因为对于企业来说, 在国家银根放松的形势下, 个户贷款额度仍旧不能满足其扩张的需求, 而以联保的形式申贷, 将能获取比单个企业申贷还多的贷款。
对于银行来说, 联保的企业在某个限度内申请贷款的安全性和偿债能力比单个企业更高, 即使这个限度很难把握或者经常被忽视从而导致风险捆绑和积累。短期内由于行业需求旺盛及经济持续向好, 银行认为联保的风险更低, 而且可以获得更多的利息, 因此也积极放贷。
所以在这个时期, 银行与企业之间的博弈属于合作博弈。
实际上, 银行为了降低自身风险总是过分依赖担保, 忽略了贷前审查, 致使B型企业大量充斥担保圈。结果银行为了促成联保互保而降低自身风险的初衷反而使得联保互保出现了更大的集群性、捆绑性风险。
3. 银行与银行之间的非合作博弈。
在经济上升时期, 银行之间为了拉拢联保企业, 必须采取各种优惠措施, 毋庸置疑, 这个时期银行之间的博弈属于非合作博弈。
为了争夺联保企业资源, 银行普遍采取低息的模式给贷, 转而使用利转费的方法, 增加中间业务。虽说此做法有可能提升盈利, 但同时使得银行的收益与企业的经营情况挂钩、收入来源降低了稳定性。若企业经营情况惨淡, 现金业务少, 财务咨询等需求低, 银行收益将会减少, 并且会影响其他担保企业的经营状况, 最后的银行损失将扩大。
(三) 第二阶段:扩张阶段
1. 企业与企业之间寻求扩张的非合作博弈。
在对全国担保圈破产的事件进行研究后可知, 在行业形势好、初期市场尚未饱和的时期, 大多数小微企业的盈利颇为可观, 因此A、B型企业会根据自己的企业状况二次贷款以扩张自己的企业, 企业之间的非合作博弈便发生了。
A型企业初期会严格按照自身企业的经营状况、行业形势的变化状况进行理性扩张, 其扩张有益于市场。而B型企业则不同, B性企业认为风险由担保圈共同承担, 而利益由一家独得, 所以有恃无恐地重复投资, 而且不甘落后, 其扩张有害于市场。
对于这种情况, A型企业一般面临两种选择。第一种是为了避免由于B性企业带来的风险突增, 退出担保圈以保证收益与风险成合适比例, 虽然自身的可贷资金降低了, 但是也同时保证了企业的健康发展。第二种选择是A型企业选择转变为B型企业, 与原有的B型企业争夺贷款与市场资源。正规扩张的A型企业由于收益与承担风险不成正比, 又不愿意放弃市场蛋糕, 因此也选择盲目扩张。上述两种选择都会导致市场中的A型企业越来越少, B型企业越来越多, 因此担保圈风险不断膨胀。
因此, 在扩张阶段, A型企业与B型企业的合作博弈转化为非合作博弈。
2. 银行与企业之间的合作博弈。
银行与企业之间的合作博弈在第二阶段与第一阶段在程度上有很大区别。首先, 小微企业在前期的高速发展给银行带来了收益, 因此银行偏向于将其贷款企业默认为A型企业。加上本来由于信息不对称, 银行对于企业性质的甄别有一定的惰性, 因此当企业再次向银行贷款的时候, 银行基本上都放开了额度与条款。而企业为了得到更多贷款, 将其原材料等物资抵押给银行, 而且普遍重复抵押。
虽然在扩张时期, 市场趋于饱和度的速度由于B型企业的增加也不断增加, 但是在达到饱和时期前还是属于市场的发展时期, 尚具盈利性。因此, 企业寻求更多的贷款以扩张, 银行放出更多贷款以意图收取未来更多收益, 两者之间仍然属于合作博弈。
(四) 第三阶段:破产阶段
1. 企业与企业之间相互转移风险责任的非合作博弈。
分析可知, 担保圈的风险来源于两个方面。第一种是系统风险, 即小微企业普遍有经营规模小、业绩不稳定、流动资产变化快、固定资产偏少的特点, 容易在发展初期破产夭折。第二种为非系统风险, 即由于B型企业的过度投资及不正当的经营战略带来的道德风险。
通过担保链条的延长, 系统风险由于担保圈的互助性小程度地降低了, 然而因为担保圈中B型企业的占比持续升高, 非系统风险不断地膨胀。
当风险加剧至均衡临界点时, 某家B型企业可能出现债务危机而破产, 为其担保的小微企业由于流动资产少及同为B型企业盲目投资, 并不能履行担保代偿责任, 因此资金链开始断裂。不能承担风险责任的企业纷纷倒闭, 有能力承担风险责任的企业由于担忧资产被分割也宣布破产, 因此整个担保圈开始瓦解。各家企业主为了逃避银行收贷开始落跑, 并且放弃了抵押物, 因此形成了颇为壮观的“跑路潮”。
2. 银行与银行之间相互转移风险责任的非合作博弈。
银行提供贷款给小微企业的目的是为了通过贷款收取利率。然而一旦担保圈出现了资金链断裂, 银行发放的贷款将有可能成为不良贷款。此时, 每家银行都有两种选择:抽贷或者不抽贷。
假设担保链中包含两家银行C、D, 两家小微企业E、F。两家银行分别对两家小微企业发放贷款m。若E出现资金困难, C、D同时抽贷, 能从F中各自收回m的贷款, 不算利率收益将各自亏损m, 若两家银行都不抽贷, 则企业E有可能通过重组转型等方式渡过难关, 重新盈利。则两家银行各自隐含的收益仍旧是m加上利率收益。因此两家银行的决策的最优方法是观察E企业重新经营的可能性P, 若P>0.5, 则选择不抽贷, 若P<0.5, 则选择抽贷。
然而现实情况是, 银行与小微企业的数量远远大于上述数量, 当其中一家银行开始抽贷, 其他银行为了避免自己收不回贷款, 也纷纷抽贷, 因此基本无法形成合作博弈的局面。
3. 企业与银行之间相互转移风险责任的非合作博弈。
由于破产企业与担保圈中的企业支付不起贷款成本而选择跑路, 银行基于自身的利益又几乎必然选择紧急抽贷, 因此企业与银行之间相互转移风险责任的非合作博弈导致了这种双输的局面出现。
资料显示, 2013年中国银行业不良贷款余额11800亿元, 比当年年初增加1016亿元, 不良贷款率1.49%。据上海高院统计, 2013年, 上海市法院受理的金融借款合同纠纷案件标的额猛增到384.86亿元, 同比增长208.80%, 占全上海市涉银行金融商事纠纷案件收案标的额的92.57%。究其原因, 主要是涉钢贸信贷案件激增。
三、结论与建议
资金短缺、融资困难从来都是我国小微企业成长历程中的一个最大的烦恼。由于自身的信贷劣势造成小微企业融资困难, 企业初期的高消耗性又使得企业主迫切需要来自银行的贷款, 因此企业为满足银行基于风险控制与自身利益的要求成立了担保圈。实际上从上述分析中可以发现, 这种行为只是将风险加大而且延后了, 一旦爆发, 产生的后果将多倍数放大。最终合作博弈破产, 酿成悲剧。然而, 联保互保作为一种能够合理缓解风险压力的担保方式是有其适用性及优势的, 关键在于参与者要遵守担保圈中的“游戏规则”。
对于小微企业来说, 寻求担保圈之前应该充分了解互保企业的信息, 了解担保链的长度及内部结构, 同时自身应该扎实经营, 避免侥幸心理, 制定合理的经营战略。
对于银行来说, 放贷之前应该严格审核, 杜绝劣性企业, 对于放贷标准也不能过分宽松, 越过底线。同时, 在出现问题时应该认真分析圈内企业的未来前景及盈利机会, 从而决定是否抽贷。
参考文献
[1]傅白水.如何化解互保联保捆绑性风险[J].浙江经济, 2012 (16) .
[2]俞云芳.刍议浙江中小企业互保联保困局的破解[J].中国市场, 2013 (21) .
非合作博弈 第10篇
关键词:复制动态博弈,演化稳定策略,品牌推广
一、前言
随着农业与农村经济整体发展的社会经济演进过程, 农业产业化渐渐成为部分农村农业运作的主要方式之一。产业化使农产品加工生产呈现了规模化、系列化、标准化的特点, 这也为农产品的品牌化奠定了基础。
农产品品牌一旦得以建立和推广, 能带来消费者关于品牌的联想和行为, 这些联想和行为使产品可以获得比在没有品牌名称的条件下更多的销售额和利润, 并赋予农产品超过竞争者强大、持久和差别化的竞争优势。农产品品牌因为其自身的特性, 一般带有区域品牌的特点。因此, 其带来的利润也是相对于整个地理范围而言的。
在农产品品牌创建的过程中, 由于能够得到的利益较大, 大型企业做贡献的积极性也较大, 而中小农户大多期望企业进行此项投资而自己“搭便车”。在目前的研究中, 往往忽略了农业协会在品牌建设中的作用, 而直接考虑“龙头企业+农户”的模式。实际上龙头企业按照基地区域划分, 通过村委会或农业协会、农场等中介组织来签订农户订单, 才是比较普遍的产业化经营模式。“企业+协会”的这种品牌推广合作机制, 往往表现为, 龙头企业着重通过全国品牌投入建立产品形象, 让顾客认识产品, 刺激顾客的品牌意识;协会则着力于推广地区性广告, 吸引更多农户加入协会并与企业建立契约, 从事相关农产品的种植。本文将运用动态演化博弈理论, 构建龙头企业与农业协会合作品牌推广的复制动态学习模型, 求解出相互合作分担投入的演化稳定策略。
二、集体品牌推广行为的演化博弈
(一) 基本假设
1.假设企业和协会都有独立决策权。龙头企业在该地区选择经营的主导产品均由协会负责供应, 企业不收购协会组织外农户生产提供的该类农产品。
2.假设品牌价值与产品的全国性品牌投入和地区性广告投入有关, 品牌价值函数V=UP11aγ+P2U2bδ+ε。其中a表示地区性推广投入, b表示产品全国性品牌投入, P1代表农户选择加入协会的概率, P2代表消费者选择农产品的概率, U1和U2分别代表农产品带给农户和消费者的认可程度, γ和δ则分别代表地区性推广和全国品牌投入对品牌价值的影响效应, γ和δ均为大于零的数;ε是影响品牌价值的随机变数。
3.假设协会投资地区性推广费用为at, 企业对产品全国性品牌投入为bh, 与此同时企业分担地区性推广投入的比率为 (1-t) (01-t0.5) , 协会分担全国性品牌投入的比率为 (1-h) (01-h<0.5) 。那么企业分担的地区性广告投入为a (l-t) , 协会分担的品牌投入为b (1-h) 。当t=1时, 表示龙头企业不分担地区性广告投入;当h=1时, 表示协会不分担品牌投入。
4.龙头企业和协会双方都不确定对方是否会分担广告投入及分担的比例, 且龙头企业和协会都是有限理性的, 他们考虑长期合作, 通过学习不断改变自身策略直到达到一个均衡为止。
(二) 模型构建
一般情况下, 农产品的全国性品牌投入是由企业来承担的, 而地区性推广投入则由协会来负责。本文则以企业和协会分别分担一部分地区性推广投入和全国品牌投入作为创新激励策略来构建模型。协会可选的决策是:分担品牌投入、不分担品牌投入, 它不知道企业是否会分担地区性推广投入以及分担比例。企业也不确定协会是否会分担部分品牌投入以及分担的比例, 企业的可选策略是:分担地区性广告投入、不分担地区性广告投入。由于协会和企业往往是长期合作的, 他们之间的策略均衡不会一次性选择完全理性下的最优策略, 而是通过学习调整后的结果。因为协会和企业是相互作用决策, 并且决策过程具有不对称性和有限理性, 所以可以根据动态演化博弈理论构建和分析模型。
企业群体与协会群体发生演化博弈, 每次博弈参与人是由企业群体中的一个龙头企业与相应农产品协会组成, 每个群体成员都是用复制动态决策改变各自策略的。根据前文的假设, 可以计算单个企业和其相应农产品协会的2*2收益矩阵, 如表l所示。
假设x为协会群体里的选择分担品牌投入的协会比例, 则 (1-x) 就是选择不分担品牌投入的协会比例;假设y为企业群体里选择分担地区性推广投入的企业比例, 则 (1-y) 为企业群体里不分担地区性推广投入的。那么根据复制动态机制可得出以下结论:
采用分担品牌投入策略的农产品协会的期望收益1E1, 采用不分担品牌投入策略的协会的期望收益E21和协会群体平均期望收益分别为:
将x对时间求导, 可以得到协会群体的复制动态方程:
龙头企业选择不分担地区性推广费用, 协会选择不分担品牌投入 (X=0, Y=0) 这个平衡点能达到演化稳定均衡。
将平衡点 (0, 1) 带入协会和企业的复制动态方程检验, 有:
当方程的解为ESS时, 此时亦需要满足即当满足条件:
这个平衡点能打到演化稳定均衡。另外两个演化稳定策略可依此类推。
从稳定需满足的条件可以看出, 模型的均衡结果由十二个参数决定, 它们分别是:品牌价值反映到协会收益上的系数α, 反映到龙头企业收益上的系数β, 地区性推广投入a, 产品全国性品牌投入b, 协会分担品牌投入的比率h, 企业分担地区性推广投入的比率t, 以及品牌价值函数中代表农户选择加入协会的概率P1, 代表消费者选择农产品的概率P2, 代表农产品带给农户和消费者的认可程度U1和U2, 以及分别代表地区性推广和全国品牌投入对品牌价值的影响效应γ和δ。这些参数不仅影响模型的均衡结果, 也会影响最终收益值, 在达到演化稳定均衡时, 这个均衡就是模型的最优收益。
三、结论
当龙头企业与行业协会逐渐处于对等地位即能从品牌价值中获得较相当的收益时, 企业与协会倾向于采取合作广告机制。本文构建了在企业与协会信息不对称的情况下, 龙头企业与行业协会双方分别分担一部分产品品牌投入和地区性推广投入的动态合作模型。然后, 运用演化博弈理论对模型进行求解分析, 得出初步的结论是: (1) 模型的四个复制动态平衡点都有可能是演化稳定策略, 是否ESS还要由十二个参数决定; (2) 参数影响了协会和企业采取分担广告投入策略时能获得收益增额的大小。
因为地域差异, 我国农村农业组织化程度和产业化模式表现出多样性。文章只考虑了“龙头企业+协会”的品牌合作推广模型。以后可以考虑应用多种群演化博弈研究多层级的品牌合作推广问题。
参考文献
[1]浦徐进, 蒋力, 刘焕明.农户维护集体品牌的行为分析:个人声誉与组织声誉的互动[J].农业经济问题, 2011 (04) .
[2]谢识予.有限理性条件下的进化博弈理论[J].上海财经大学学报, 2001 (05) .
(IT)金山、连邦展开博弈合作 第11篇
本来看似完全独立的两个公司的内部行为,而今却不断被外界对比、关联看待。“这一切缘于网络游戏带动下的软件渠道变革,作为生产制造方的金山和渠道销售方的连邦正在进入博弈合作时代。”赵一语点破其中玄机。
开发商、渠道商盯准网吧市场
3月中旬,国内最大的通用软件商—金山软件股份公司正式发布网游策略,同时掀起了一场规模磅礴的网吧布局。据金山方面介绍,公司从年初就开始面向全国二级市场派驻区域经理和网游辅导员(GM Offline线下游戏管理员),其主要目标是打入全国近20万家网吧。
在完成11座重点城市网吧扫荡式推广后,金山网游营销团队已经快速扩充到1500人左右,并最终面向更为广阔的二级甚至三级市场展开“百团大战”,组建了100个团队,计划再用三个月将终端彻底渗透进全国100个二级市场。依靠这些地级市,将下面的市县带动起来。“用你手下最得力的销售人员,进攻二级市场,因为这里是我们的战略关键。”进入2004年以来,金山副总裁王峰不断向下属灌输这样的观念,“我到南京时,马上命令他们把最好的人调到苏州去。”抢占每一个网吧,《剑侠情缘》的广告招贴要张贴在最好的位置上。
金山网吧圈地营销事件在业内引起了颇多反响,但是为众人所不知的是,在网游市场面向网吧的征战,已经到了白热化的状态,其他网游巨头其实下手更早。盛大、骏网、九城等无一不是网吧经营高手。以骏网为例,公司自2000年获得1500万美元的风险投资之后,已经在全国14个城市设立子公司,而未来两年公司计划发展10万家经销商,其中大部分就是网吧。
这一目标与连邦的计划旗鼓相当。连邦从今年开始也在内部定下了掌控“万家”网吧的宏伟目标。
这一系列举动引起了颇多关注,因为不少人相信一场规模颇大的市场运作也在悄然进行之中。年初连邦的内部规划显示,公司的新目标着重放在规模发展上,并计划在未来一至两年内,完成连邦“千店工程”,使全国“连邦软件专卖店”增加到1000家。“而且还不仅如此。”连邦员工程女士透露,年内公司还将完成“万家网吧”计划,即:占领全国最大的一万家网吧,从而最终形成千店万网混战中国网游市场的局面。
从1994年成立至今,连邦用了10年时间在全国布点数目不过400余家,而今却要用两年时间急速扩张至千家,扩张目标无异于向渠道狠布猛局,而网吧成为其中一剂猛药。
3月18号,连邦正式对外发布了2004年战略暨连邦“网盟2.0”,正式推广自己的数字渠道策略。宣布对旗下庞大的连锁营销系统进行数字化革命性升级,建立全国数字化IT营销平台(连邦网络销售联盟),同时宣布进军数字娱乐事业。从很大程度上,联邦再次明确了网游市场策略。
步步紧逼,步步为营,来自研发商和渠道商的目标纷纷盯准网吧市场。
网吧为什么如此红火,王峰的一本“网吧经”可以使我们领略一二。3月底王峰告诉笔者:“网吧市场已经成为金山网络游戏的战略性市场,其内部的年轻客户群体不断更新换代,不断会有新人接触金山游戏,而成长起来的资深玩家会继续使用家庭电脑玩游戏,这无疑为金山网络游戏带来了最大最好的用户基础。”言语间,网吧不但是金山网络游戏的消费大户,还因为其强烈的体验传播功能成为金山网络游戏的“用户黄埔军校”。
同时来自中国最成功的网络游戏运营商——上海盛大方面的信息也表明了网吧的重要,上海盛大内部人士表示:“我们原来也是沿用传统思维方式——通过找代理销售,但到后来我们注意到70%的客户的游戏场所是网吧。”于是盛大“甩开渠道”,开始利用自己的销售公司——恒康来负责游戏线上、线下点卡的销售业务。
产业链上下,彼此觊觎
盛大70%的利润来自网吧,这也就无怪乎网吧能引无数英雄折腰。但同时这种竞争也使得固有的软件产业链条已经不能适应这种变化。
对于金山和连邦而言,多年来他们一直是亲密无间的合作伙伴,连邦一直是金山工具软件最大的渠道。在进入网游市场后这种关系继续延用,2003年下半年,连邦花高价4000万元获得了金山《剑侠情缘网络版》的总代理权。这在当时业内看来,连邦给了金山最大的支持。
但在如今盛大日进斗金的时代,仅仅4000万元的水平显然不能满足金山的胃口。
王峰正式挂印网游业务之前,金山内部总裁会一致认为,网游业务是可以短期内帮助金山带来巨大营收的项目。为此金山提出将把去年所有利润全部投入网游市场。根据王峰给出的数字,2003年,金山的营业收入大约在1.5亿元人民币,利润大概在4000万元至5000万元的水平。
仅仅2004年一年的投入计划就是5000万元的规模,金山对于网络游戏的收入期盼显然不能满足于千万级水平。如何提高营收?金山逐渐开始反醒渠道的变迁。
王峰表示:“发展到今天,我们已经看到网游正在与通常的软件行业分离而形成单独的行业体系,同样是做营销、管渠道,进来以后才会发现,网游市场与传统软件管理完全不同。你可以看一下,以前金山在做什么?打盗版。但是现在不需要了,主要工作在于日常服务、销售点卡。相应渠道感觉也在变,我和连邦副总林粤是好朋友,以前我每天要打电话向他询问毒霸的出货量,而现在不用了,每天《剑网》全国充卡人数在系统中一目了然,相反连邦方面需要探问我每天的充卡数量,这就可以看出网游市场所引发的渠道变革。”
有观点认为中国网络游戏市场的完整产业链已经基本形成,并且出现五种不同模式类别:开发商、代理商、运营商、通路商、销售渠道、运营支持厂商,“运营商是创造网络游戏增值的主角,获得产业的大部分收入。”因而成为运营商几乎已经成为上游开发商和下游渠道分销商们的共同愿望。这种心态不光埋藏在金山心中,就是连邦方面也早已对涉足运营蠢蠢欲动。2003年,时任连邦总裁的李儒雄曾经对外界宣布:“我们的新模式是,砍掉运营商,开发商前进一步,我们(发行商)上前一步。” 李的话彻底表明了连邦的野心。
博弈合作不可避免
开发商进一步就是运营商,而连邦上前一步也变成运营商,这句分析起来颇有矛盾的言语,不经意间揭示出在新环境下,产业变迁,双方撞车已成必然。
多年合作伙伴,一朝成为竞争对手,恐怕这是谁也不愿面对的,更何况,彼此之间还有千丝万缕的业务联系,需要在合作平台下完成,于是金山连邦展开了一场博弈合作。
在词霸、毒霸等等工具软件与连邦继续展开大规模合作的同时,网游市场金山采取了“实虚点卡”分离销售的方式,实卡交给连邦代理,虚卡自行销售。表面上看来金山只是采取运营商的通行作法,但是这种合作模式,使得整个过程蕴藏多重变数。
首先一旦市场成熟,运营商可以控制实卡数量,达到扩大虚卡消费的目的,比如延长实卡交货周期,造成渠道缺货;利用实卡存在渠道成本和一定硬件成本的特点,减低虚卡价格蚕食掉实卡最优秀的用户群。虽然王笑言金山从不会这样做,但这种合作模式显然对连邦不利。
另一方面一旦连邦找到好的产品,直接运营自己的网游业务,又事必会因此损害金山的网游实卡推广工作。
所以从某种意义上理解,金山要在网游这一产品线打破固有工具软件合作方式,尽可能缩短利润分流的环节,并最终独自完成研发、运营、销售工作,实现三位一体。这不但是从利益最大化考虑,也是安全运营的第一需要。
而对于连邦来说,网游带来的渠道变革则需要百般小心,如果金山渠道模式完成,组建出的“超级销售团队”未必不会向工具软件阵营扩张。
非合作博弈 第12篇
为了提高频谱利用率,5G(第5 代移动通信技术)中提出了D2D(设备到设备)技术[1],但其会带来严重的系统干扰。目前针对D2D多小区干扰问题的研究比较少[2,3],本文引进非合作博弈论对D2D混合多小区内的资源进行合理分配,以达到控制系统干扰的目的。
文献[4]提出了一个基于联合频谱分配和功率分配的定价机制,通过分散干扰来保证服务质量,但没有确切的将干扰引入博弈中考虑。文献[5]研究了相邻小区共同的D2D链路通过小区基站之间的博弈来获取资源从而达到均衡。文献[6]研究了多小区中D2D网络的非合作博弈功率控制方法,但建立的效用函数对于功率小于零的情况是不成立的。基于以上分析,本文提出一种改进的基于定价机制的非合作博弈资源分配方法,既考虑通过信道增益来提升公平性,同时也将干扰引进效用函数中。
1 系统模型
一个多小区D2D通信的无线混合系统模型如图1所示。系统采用全频率复用方式进行通信,且每个蜂窝用户分配的资源是正交的,但一个蜂窝用户的资源可以被多条D2D链路复用。本文针对系统存在两条或两条以上的D2D链路且复用相同的资源时产生干扰的情况,提出了一种改进的非合作博弈资源分配方法。
注:Cell为蜂窝小区;BS为基站
设系统包含K个小区,每个小区包含一个BS,Q个随机分布的CU (蜂窝用户),M对D2D链路(D2DTx-D2DRx),总带宽为W ,资源块数目为T。则D2D接收端的SINR(信干噪比)为
式中,pndi为复用第n个蜂窝用户和D2D用户的发射功率;pndj为除了第i个D2D链路之外复用同样蜂窝用户资源的D2D链路;gndi、gndj,di、gncq,di分别为各条链路的增益,N0为信道噪声。
2 基于非合作博弈的资源分配算法
基于以上分析,D2D链路功率的收益函数可表示为
每一个参与博弈的用户都希望自身利益最大化,为了防止各用户因过分提高自身功率而对其他使用相同资源的用户造成较大的干扰,需要引入定价机制对其实施惩罚,使得其在竞争资源时折衷考虑其效用与代价。定价函数的引入可以隐含地使用户合作却不改变功率控制的非合作特性,同时还能提高系统性能。基于此,为复用资源n的D2D链路设计定价函数如下:
则博弈参与者的净效用函数为
式中,an表示博弈用户的功率定价因子。与传统的线性定价函数不同,式(4)不仅定价了博弈参与者的功率,引入了信道增益来提升系统公平性,还考虑了其他使用相同资源的用户对当前博弈用户的干扰这一因素。当用户受到其他用户的干扰较大时,应降低惩罚;反之,应增大惩罚。考虑到多小区D2D复用模式的特性,参与博弈的D2D链路越多,系统内的干扰就越大越复杂。令式(4)的一阶导数为零,可得用户的最优功率响应满足
则参与博弈的D2D链路最优响应函数为
2.1 纳什均衡的存在性
对于本文提出的NPAGP-I(考虑干扰的非合作功率分配博弈)算法,分析如下:(1)D2D链路数目有限,参与者集合Q是一个有限集;(2)博弈参与者i在资源n上的策略空间为Pndi= [0,pnmax],显然Pndi是正实数空间R+上的一个非空的、闭的凸集;(3)博弈参与者i的效用函数uid(pi,p-i)在策略空间Pndi=[0,pnmax]是连续的[7]。用户uid的净效用函数对pndi的二阶偏导数为
可得uid(pndi,pn-di)对pndi是凹的,且是拟凹函数,则存在NEP(纳什均衡点)。
2.2 纳什均衡的唯一性
由最优响应函数pndi≥0可得an的取值范围为an≤1/ln2。要证明NEP的唯一性,关键是证明最优响应函数是标准函数值,即满足正性、单调性和可测量性。由an的取值范围可以保证功率求解表达式大于0,即满足了正性。
由pndi的表达式可知,由于某个D2D链路的自身发射功率与复用相同资源的其他D2D链路和蜂窝用户的干扰发射功率有关,则可令P = A(P)。设P ≥ P′,则有
则表达式为递增函数,且当P = P′ 时取等号。
证明可测量性,即是要证明对λ > 1,有λA(P)≥ A(λP)。由于
因此表达式满足可测量性。故存在唯一的NEP。
2.3 考虑干扰的分布式功率迭代算法实现
本文中蜂窝用户采用的是轮询调度方法,而对于D2D用户,采用的是基于本小区内最大SINR的用户调度方案。用户调度完成后,将按照以下步骤实现功率迭代算法:
(1)t=0时,D2D链路以各发射节点所分配到资源块上的平均最大发射功率作为各资源块上D2D发射端的初始化功率,n ∈{1,2,…,T};
(2)将上一次迭代所得到的在资源n上的发射功率pndi(t)代入式(6),得到更新后新的发射功率pndi(t+1);
(3)判定|pndi(t+1)-pndi(t)<η|是否成立,其中η为迭代精度(无限接近于0的极小值),若超过设置的最大迭代次数,则迭代直接结束;若结果不成立,但是处于迭代次数范围之内,则令t=t+1,重复步骤(2)。
3 仿真分析
为了验证所提算法的性能,采用Matlab软件进行算法仿真实现。考虑一个3小区的D2D通信混合网络场景。 仿真参数设置如下:系统带宽为10 MHz,小区的站间距为500m,各小区内随机分布10个蜂窝用户,5对D2D用户,蜂窝用户的最大发射功率为23dBm,D2D用户最大发射功率为10dBm;系统的热噪声密度为-174dBm/Hz。蜂窝链路的路损模型为128.1+37.6lgd;D2D链路的路损模型为:148+40lgd。
图2所示为不同惩罚因子下D2D用户吞吐量的变化趋势。由图可知,随着功率惩罚因子的增大,D2D用户的吞吐量呈现先增长后下降的趋势,这是因为各用户最初都以较小的发射功率进行通信,相互之间干扰较小,使得吞吐量提升。而随着惩罚因子超过最佳值时,各用户功率慢慢增大,干扰也随之增大,使得吞吐量开始逐渐下降。惩罚因子为0.7时,系统中D2D用户的吞吐量达到最大值。
在仿真过程中,将本文所提NPAGP-I算法与其他几种不同的算法作了性能对比,包括EPA(功率均分)和考虑功率平方定价机制的NPAGP-P2(非合作功率分配博弈)[7]。
图3所示为各用户的公平性指数。由图可见,相比于EPA,NPAGP-P2和NPAGP-I两种算法公平性指数较高,这是因为NPAGP-P2和NPAGP-I算法的效用函数引入了信道增益,对信道条件不同的用户进行了区分考虑,以免造成信道条件越好的用户所分配的资源越多。而NPAGP-I算法在效用函数中还多引入了干扰因素,对于干扰大的用户惩罚更大,同理,干扰小的用户惩罚小,因此公平性要优于NPAGP-P2。同时,在进行D2D通信时,必须首先保证蜂窝用户的通信,所以蜂窝用户公平性的提升要明显很多。
图4所示为不同算法下各小区吞吐量的比较。对比EPA算法,由于NPAGP-P2与NPAGP-I两种算法是基于非合作博弈模型进行功率分配,通过对惩罚因子的调整,在考虑自身惩罚代价的前提下,通过功率的迭代达到一个最稳定的状态,在一定程度上也降低了小区内和区间干扰,从而使系统吞吐量得到提升。由于在自适应调整功率时,功率上下的幅度并不大,所以吞吐量之间的差异较小。
图5所示为几种不同算法下D2D吞吐量的CDF(概率累积函数)曲线。NPAGP-P2和NPAGP-I算法通过博弈模型对参与者的功率进行自适应控制,因此相互之间的干扰也会自适应调整,这两种算法吞吐量的提升比EPA算法高,且NPAGP-I算法由于对干扰进行直接控制,因此吞吐量提升更明显。由于博弈过程中功率变化将导致干扰的变化,通信过程中会出现干扰不可控的情况,所以相比于EPA算法NPAGP-P2和NPAGP-I两种算法的CDF曲线要弯折一些。
4 结束语
随着D2D系统在无线通信网络的广泛应用,干扰问题成为人们关注的重点。博弈论作为通信领域的一个重要研究方法,在D2D通信中的应用也越来越广泛。本文采用了博弈论中的非合作博弈方法对多小区内的D2D通信资源分配问题进行了研究。在建立非合作博弈模型之后,引入定价机制,采用带有干扰因素的效用函数对D2D链路的功率进行迭代运算,通过证明纳什均衡的存在性和唯一性,得出功率的稳定值。仿真结果表明,本文所提算法通过对干扰的惩罚,提高了系统的公平性和用户吞吐量。
参考文献
[1]Doppler K,Rinne M,Wijting C,et al.Device-to-device communication as an underlay to LTE-Advanced networks[J].Wireless Communicati-ons,IEEE,2009,47(12):42-49.
[2]Xu Shaoyi,Wang Haiming,Chen Tao.Effective Interference Cancellation Mechanisms for D2DCommunication in Multi-Cell Cellular Networks[C]//VTC 2012.Yokohama,Japan:IEEE,2012:1-5.
[3]程永生,董宇涵,张学聃.多小区CDMA系统D2D通信上行性能研究[J].计算机工程,2013,(07):11-15.
[4]杨春刚,李建东,李维英.认知无线电中基于非合作博弈的功率分配方法[J].西安电子科技大学学报,2009,(01):1-4,27.
[5]Yin Rui,Yu Guanding,Zhang Huazi,et al.PricingBased Interference Coordination for D2DCommunications in Cellular Networks[J].IEEE Transactions on,2015,14(3):1519-1532.
[6]Huang Jun,Zhao Yanxiao,Sohraby K.Game-Theoretic Resource Allocation for Intercell Device-to-Device Communication UnderlayingCellular Network[C]//NWRCS 2014.Shanghai,China:IEEE,2014:79-83.
非合作博弈范文
声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。如若本站内容侵犯了原著者的合法权益,可联系本站删除。


