基于惩罚机制的产学研合作演化博弈分析-王小杨.pdf
《基于惩罚机制的产学研合作演化博弈分析-王小杨.pdf》由会员分享,可在线阅读,更多相关《基于惩罚机制的产学研合作演化博弈分析-王小杨.pdf(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2017年第9期 科技管理研究Science and Technology Management Research 2017 No9doi:103969jissn10007695201709018基于惩罚机制的产学研合作演化博弈分析王小杨1,张 雷2,杜晓荣2(1电子科技大学中山学院经贸学院,广东中山 528400;2中山大学,广东广州 510275)摘要:产学研合作对构建国家创新体系和实现向创新驱动型经济体转变具有重要的作用,而在新形势下,多方参与的产学研合作模式成为主流,为保证各方的利益及合作顺利进行,在长期合作中需要有一定的约束惩罚机制。首先建立多人多策略的演化博弈模型,并对各情况下的收
2、益进行分析计算然后建立惩罚机制,并把惩罚和收益关联起来,调整各方不同情况下的收盏之后使用粒子群优化算法进行模拟仿真,摒弃传统固定好数值的静态模拟方法,考虑“支出一收益”比例和“惩罚一收益”比例的动态数值分析,模拟得出惩罚约束存在下多人多策略的产学研合作演化情况最后,得出结论并提出相应妁对策建议。关键词:产学研合作,演化博弈,雪堆模型,惩罚,粒子群优化算法中图分类号:F204;F22432;G311 文献标志杩:A 文章编号:1o一7695(2017)09一0118一07IIldustry Technology I咖oVation Amance Based仰Coopemti仰byUsing EV
3、olutionary Game TheorywANG xiaoyan91, zHANG Lei2, Du xiaomn矛(1Zhongshan Institute, University of Electmnic Science and Technology of China, ZhongshaJl 528400, China;2School ofPhysics and Engineeng, Sun Yatsen University,Guangzhou 510275, China)Abstract:Industrial techn0109y innovation alliance can p
4、mmote the industryuniversi七yinstitllte cooperationourp叩er e啦blishes nplayer and nchoice snowdriR game model to evolve cooperationThe punjshrnent mechaIlisrnsare built up f-or cooperacionBy simulation experiment, it can be seen that cooperation is closely relacive to thebenefits and has negacive corr
5、elation with costThe punishment mechanism can inspire more cooperacion andthe cooperation is related to the magnitude of the punishmentBut no matter under what kind of perfbrmancemechanism, the level of coopera七ion has negatiVe correlacion with che number of members in the 1eague;Finally,we proposed
6、 some medlods to i11lproVe the indus七ry technology innoVa七ion amance coopera七ionKey、阳rds:cooperation;eVolutionary game theory;ISD (Itemted SnowdriR dilemma);punishment目前中国全球竞争力排名第28位,领先于其他金砖国家,这主要得益于国内庞大的市场规模(位列第2名)和良好的宏观经济(位列第11名),但技术准备度和创新仅分别位列第88、33名,与产学研合作相关的指标也普遍滞后。中国目前仍是效率驱动型而非创新驱动型的经济体,创新能力和产
7、学研合作水平然仍有待提高。国家主席习近平在党的十八届五中全会上提出: “坚持创新发展,必须把创新摆在国家发展全局的核心位置,不断推进理论创新、制度创新、科技创新、文化创新等各方面创新,收稿日期基金项目项目来源:让创新贯穿党和国家一切工作,让创新在全社会蔚然成风。”因此,如何在新形势下提高产学研合作的质量和效益,成为推动我国社会经济发展和产业结构升级不可回避的命题。1 文献综述产学研合作之所以成为可能,就是因为有企业、高校、科研机构三大主体的存在。而创新目的和意义就在于使相关创新要素和资源要素聚集而形成聚集效应,产学研合作正是围绕技术创新活动而发生2016一0725,修回日期:20161029广
8、东省自然科学基金项目“复杂网络下惩罚机制对合作演化影响的研究”(2016A030310020);广东省哲学社会科学“十二五”规划项目“基于复杂网络演化博弈理论的产学研合作机制研究”(GDl5xGL03)中山市科技计划项目“大数据挖掘技术在光伏电站发电量预测中的应用”(2014A2Fc385);电子科技大学中山学院博士启动项目“复杂网络上的演化博弈动力学研究”(414YKQ04)万方数据王小杨等:基于惩罚机制的产学研合作演化博弈分析 “9的聚集。国内外很多学者从演化博弈的角度对产学研合作问题进行了研究。Feldman等研究了联盟企业在可以共享联盟中的技术、任务和禀赋的情形下成本可传递的博弈行为,
9、指出在成本最小的情况下的分配形式。Plewa等幢。研究了产学研合作演化的不同阶段,测度了每个阶段的成功,认为沟通、理解、信任和人员是普遍的驱动力。De Fuentes等o讨论了合作驱动力对互动渠道的影响以及渠道对合作收益的影响。冯锋等o基于小世界网络理论研究了产学研合作创新网络交流频率和集群程度的小世界特征及应用。刘凤朝等o研究了我国高校专利合作网络的空间演化模式,通过具体分析我国985高校之间的专利合作情况,验证空间演化结论。李成龙等o认为产学研互动模式的演化关系有利于协同创新。卢方元等o 7、刘洋等。8 o借用共生理论的解释框架提出了推进产学研合作模式进化的措施。孙舰等;构建项目合作网络内
10、企业间知识转移与知识保护策略的演化博弈模型,探讨各个因素对其路径演化及知识转移策略制定的影响作用,并据此提出促进项目合作网络内企业间知识转移的措施。殷辉等叫运用演化博弈理论比较分析两类产业中企业间随机两两配对与学研方开展合作的博弈过程,结论表明,无论何种产业,产学研合作的形成是一个逐渐演化的过程,并与合作成本呈负相关关系,而与市场风险因子、合作收益呈正相关关系。陈伟等构建了知识创新与扩散的过程模型,运用复杂网络理论和仿真方法进行分析,研究发现,集群创新合作网络的整体知识水平呈现先递增后递减的演化规律;知识增长的演化过程存在突变点,突变时期不同网络中企业知识水平分化的情况决定不同网络知识增长绩效
11、的差异性。曹霞等2 o运用演化博弈理论,在有限理性条件下构建了协同创新网络下产学研合作的演化博弈模型,将纳什等价博弈与协同学序参量方法引入模型,从理论上分析了产学研合作创新网络协同演化路径的突变特性、偏好特性和对称破缺性,仿真实现核心序参量的密度分布和矢量场分析,从而确定产学研合作创新网络协同演化路径。国内外学者在运用博弈论的方法对产学研合作创新进行研究时,多数集中在产学研双方选择“合作”或“不合作”的策略上,但是在真实的产学研博弈中,参与方的博弈策略非常丰富,参与者也是多方同时决策。而在这一类多人博弈中普遍采用的模型是公共品博弈,在长期的博弈过程中,会有约束惩罚等机制的存在来保证产学研合作的
12、顺利进行,而在之前的研究中几乎没有考虑参与者彼此之问的约束机制。本文的研究充分结合当今形势,建立多方多策略的产学研合作模型并模拟现实的交互引入惩罚约束机制,即对于背叛的一方会受到一定的惩罚,而对于合作或者创新的一方在给予背叛者惩罚的时候要付出一定的代价。在运用演化博弈理论对产学研合作创新的稳定性进行分析时,摒弃之前研究中使用固定数值分析的局限性,将支出或收益的具体数据转化为比例,把惩罚的强度与收益结合起来,动态地分析各影响因素对合作稳定性的影响,并得出结论。2 产学研合作演化博弈模型在公共品博弈的行为实验中,当赋予选择惩罚的自由时,人们也倾向于使用惩罚策略,而且这种惩罚的威胁能促使合作水平显著
13、。代价惩罚保证了背叛者不能随意享用搭便车的成果,即使是在单次博弈中互相不认识的大的群体中,惩罚者也可以立即付出代价来降低背叛者的收益而不损害组内其他成员的利益。基于上述观点,本文考虑了长期合作的各团队或组织之间的反复博弈,各方都是独立的利益主体,都以最大化自己的利益为目标,把博弈论和动态演化过程结合起来作为理论基础,建立多策略、多方的公共品博弈模型,并模拟真实情景设立惩罚机制,深入探讨不同条件下合作的演化情况。21 假设条件与支付矩阵在综合考虑产学研合作博弈的实际影响因素与模型可操作性的基础上,本文给出以下基本假设:假设1:参与主体。市场是有风险的,谁都想把风险化解到最低程度。有的成果,特别是
14、大型项目,尽管有市场,但因投资大,双方合作无法解决投资问题,于是就出现多向合作模式。产学研合作博弈中有两类参与者,分别为高校(s)与企业(c)。但是参与者的主体并不局限于两个单位或组织,几方在价值取向、认知能力方面各有不同。对于企业,追求利海对于高校或科研院所,需要贡献科研成果对于政府,有政绩要求;对于中介方,可得到一部分的利益。因此,各参与方在博弈过程中不断调整策略以达到最优均衡。假设2:博弈策略。在传统的研究中,“合作”(c)与“不合作”(D)是参与方的两个选择,但是在当今的产学研合作各方中,除了学校和企业可以提供技术创薪外,还存在着政府或者中介等机构,这些机构除了能够保障产学研合作顺利进
15、行,还可以从中获得一定的利益,因此在我们的博弈策略中增加一类“不参与者”(L),指不直接参与技术创新,但是又能从博弈中获得一定的利益的合作者。在产学研合作过程中,对于违约或不合作的一方,会对万方数据王小杨等:基于惩罚机制的产学研合作演化博弈分析其进行惩罚,但是惩罚的权利只能在选择合作的一方手中,我们将这类合作者定义为“惩罚者”(M)。惩罚者在惩罚其他人的时候也要付出一定的代价,如果群体中不存在背叛者,那么“惩罚者”就是合作者。假设3:带惩罚机制的收益矩阵。选择雪堆模型引(又称为“鹰鸽”博弈或者“小鸡”博弈)来讨论个体理性和群体理性的矛盾和对立,并根据假设2的博弈策略,得到收益矩阵如表1所示。表
16、1 产学研合作的经典雪堆博弈收益矩阵合作 占1,2 占一背频 6 O其中:对于合作者来说,当对方选择背叛,那么合作者在获得6收益的同时要付出c的代价,得到收益(_6唧);如果对方选择合作,则双方的收益均为(6_c2)。而对于背叛者来说,如果对方选择合作,其将获得6的收益;如果对方选择背叛,其将没有收益。对于不参与者,将得到一定的收益盯。对于惩罚者,惩罚背叛者时需要付出y的代价,让背叛者的收益减少口。从表2可以发现,惩罚行为会给惩罚者和被惩罚者双方都造成负收益,因此将极大地降低群体收益,甚至从短期来看,会造成带来的合作提升不足以弥补惩罚造成的损失;但通过长期多次的交互,惩罚机制的效应会得到验证。
17、表2产学研合作多策略的雪堆博弈收益矩阵D D J|) 占L 盯 盯 盯 盯C 占一e 占一c 由一fj,2 6一f以M 占一c一, 占一c rj,2 占一(222 产学研合作行为的演化博弈分析针对本文上述假设条件,对产学研合作的演化过程递进讨论。2-21 多人的雪堆博弈根据表2,得出多人博弈的收益计算方法如公式(1):nn=6一c,对合作者6一。一”对惩罚者6一,旃蔷叛者,当fo “)0,对背叛者,当f_0西对不参与者针对公式(1),在多人参与的雪堆博弈模型中,如果在群体中只有1个合作者则收益是6_c;如果有2个合作者,那么收益为6叼,2;如果有3个合作者,则收益为6叼3。以此类推,可以得到合
18、作者的收益。因此当群体中至少存在一个合作者时,“搭便车”者不用做任何事情便得到收益6;如果群体中没有任何合作者,则收益为0。222 惩罚机制下的多策略产学研博弈对应表1的收益矩阵,假设某博弈方A选择合作的概率为x1,选择成为惩罚者的概率为x2,选择成为中立人的概率为盖3,选择成为不合作者的概率为(1唢l哨2嘣3);则对方B选择合作的概率为y1,选择成为惩罚者的概率为y2,选择成为中立人的概率为y3,选择不合作的概率为(1一y1一y2一y3)。则某博弈方A选择合作时的期望收益为:U。2(6一c2)+只+(6一c2)+少。+(6一c)4y,+(6一c)+(1一X一少2一y,)某博弈方A选择成为惩罚
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 惩罚 机制 产学研 合作 演化 博弈 分析 王小杨
限制150内