中国博弈论新近进展及展望
摘要
1944 年著名数学家冯·诺伊曼和经济学家莫根施坦合著并出版的《博弈论与经济行为》
标志着博弈论作为一门独立学科的诞生。在国际上,从 1994 到 2012 年,博弈论学家已先后
获得 6 届诺贝尔经济学奖,对于一个运筹学分支而言这是一个奇迹。随着运筹学的发展,博
弈论在中国也取得了飞速的进步。本报告介绍了国内外博弈论的发展历程、主要研究方向以
及常用术语的中文规范。针对八个主要方面重点介绍了国内外的研究现状以及未来五年的发
展趋势展望,具体的,包括对策理论、对策论与互联网、算法博弈论、对策与社会科学、对
策与可持续发展、不确定性与对策、组合拍卖以及带熵博弈局势分析。
Recent Development and Future Prospect of
Game Theory in China
In 1944, the masterpiece of‘Theory of Games and Economic Behavior’ written by famous
mathematician John von Neumann and economist Oskar Morgenstern marks the game theory as
an independent subject. Experts in game theory have won six Nobel Prizes in economics from
1994 to 2012, which is a miracle for a branch of operation research. With the development of
operations research, the study of game theory in China has been gotten rapid advances. In this
chapter we first present a brief history, definition and Chinese technical terms of game theory.
Then we review advances and tendencies in eight research topics including game theory, Internet
and game theory, algorithmic game theory, social science and game theory, sustainable
development and game theory, uncertainty and game theory, combinatorial auction, situation
analysis on games with entropy.
一、引言
博弈论,亦名“对策论”、“赛局理论”,是运筹学的一个重要学科。具有竞争或对抗性质
的行为称为博弈行为。在这类行为中,参加斗争或竞争的各方各自具有不同的目标或利益。
为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己
最为有利或最为合理的方案。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们
的优化策略。博弈论主要研究公式化了的激励结构间的相互作用,博弈行为中斗争各方是否
存在着最合理的行为方案,以及如何找到这个合理的行为方案的数学理论和方法。博弈论不
仅是经济学的标准分析工具之一,还在生物学、经济学、国际关系、计算机科学、政治学、
军事战略和其他很多学科都有广泛的应用。
根据不同的标准有不同的博弈分类。博弈可以分为合作博弈和非合作博弈,区别在于博
弈参与者策略选择的出发点是所在联盟的整体利益还是个体利益。博弈也可分为静态博弈和
动态博弈。静态博弈是指在博弈中,参与者同时进行策略选择或虽非同时选择但后行动者并
不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的策略选择有先后顺
序。“石头、剪子、布”游戏属于静态博弈,而棋牌类游戏则属于动态博弈。按照参与人对博
弈信息的了解程度可分为完全信息博弈和不完全信息博弈。完全信息博弈是指在博弈过程
中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。如果有参与者
对上述信息的全部或部分了解得不够准确或者不是完全了解,这种情况下进行的博弈就是不
1
完全信息博弈。目前经济学家们通常所谈论的博弈多为非合作博弈,非合作博弈又可细分为
完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈以及不完全信息动态博弈。与
上述四种博弈相对应的均衡概念为纳什均衡、子博弈精炼纳什均衡,贝叶斯纳什均衡以及精
炼贝叶斯纳什均衡。博弈还有很多分类方式,例如以表现形式也可以分为规范型博弈或者扩
展型博弈。
博弈论的研究对象与社会、政治、军事、经济、科学、技术等很多领域都有密切关系,
是运筹学及相关领域的重要研究热点。博弈论涉及的学科甚广,包括数学、统计学、工程学、
生物学、经济学、金融学、市场学、政治科学以及管理科学等等。经典博弈理论体系的主要
组成部分包括零和博弈、非合作博弈、合作博弈、微分博弈、模糊博弈、机制设计以及演化
博弈理论等。而诸如算法博弈、网络博弈、组合拍卖、合作的演化、由具有有限理性的行为
主体参与的博弈以及博弈理论在可持续发展等问题中的应用研究则构成当今博弈理论最为
前沿和热点的研究领域。
二、博弈论的发展
有关博弈论的策略性互动的理念可追溯到我国古代军事学家孙武的《孙子兵法》,当中
的“知己知彼,百战不殆”已显示出博弈论研究中决策者之间互动的重要性。而有关博弈论的
数学研究则可追溯到 1654 年巴斯卡和费马的五篇书信,当中所讨论到的赌金分配问题已具
有博弈论的雏形,并且为概率论的发展奠定了基础。在经济学领域,古诺和伯特兰德已经运
用博弈论的思想对垄断定价、生产和交易行为进行了研究。现代博弈论起源于上个世纪初,
以策梅洛、博雷尔和诺伊曼等人的工作为代表。二次世界大战为博弈论的应用提供了广泛的
背景,加快了博弈论体系的形成。1944 年著名数学家诺伊曼和经济学家摩根斯坦合著的专
标志着博弈论作为一门独立学科的诞生。
[1]
20 世纪五六十年代是博弈论研究、发展的重要阶段。纳什在 1950 年和 1951 年发表了
著
两篇关于非合作博弈的重要论文
,明确提出了纳什均衡这一基本概念,针对纳什均衡所
[2,3]
[4]
[5]
展开的研究成为博弈理论发展的一条主线索。泽尔腾将纳什均衡的概念引入到动态分析,提
出了子博弈精炼纳什均衡的概念
;海萨尼则把不完全信息引入博弈论的研究,提出了贝叶
。由于纳什、泽尔腾和海萨尼在非合作博弈的均衡分析理论方面所做出
斯纳什均衡的概念
了开创性的贡献,他们共同荣获了 1994 年的诺贝尔经济学奖。
1944 年冯·诺伊曼和经济学家奥斯卡·摩根斯坦已经提出并建立稳定集作为合作博弈的
解,在之后的二十多年间,合作博弈理论体系以及一系列经典的合作博弈的解概念得以建立。
1953 年吉利斯提出了核心的概念,后经沙普利和舒贝克发展成为合作博弈解的概念
[6]
在 1953 年沙普利运用公理化方法建立了沙普利值
,1964 年奥曼和梅斯科勒引入合作博弈
[7]
的谈判集,1965 年戴维斯和梅斯科勒建立了核,1969 年施梅德勒建立了核仁,1974 年欧文
,1977 年迈尔森提出迈尔森值等作为合作博弈的解
。此外,1950 年纳什建
[9]
[8]
。
[2]
立了著名的讨价还价模型,提出了纳什谈判解的概念及其解法
提出欧文值
。同样
博弈论的出现令经济学产生了前所未有的变化,对当代经济学带来了革命性的冲击。博
弈论不单在经济学领域被广泛地应用,更已成为经济分析的标准工具之一。由于人类的经济
活动离不开人与人之间的策略互动,因此忽略人际策略相互作用的经济分析始终是行不通
的,如此看来,博弈论的兴起是无可避免的。
从 1994 到 2012 年,博弈论学家已先后获得六届诺贝尔经济学奖,对于一个运筹学分支
而言这几乎是一个奇迹。莫里斯、维克瑞共同荣获了 1996 年的诺贝尔经济学奖,前者在信
息经济学领域做出了重大贡献,尤其是不对称信息条件下的经济激励理论;后者在信息经济
学、激励理论、博弈论等方面都做出了重要的贡献。阿克尔洛夫的旧车市场模型开创了逆向
选择理论的先河,斯宾塞的劳动力市场模型创立了信号传递理论,罗斯柴尔德和斯蒂格利茨
2
夫、斯宾塞和斯蒂格利茨,以表彰他们在对充满不对称信息市场进行分析领域所做出的重要
建立了一个关于竞争的保险市场的信息甄别模型。2001 年诺贝尔经济学奖授予了阿克尔洛
贡献。此外,奥曼和谢林因为“通过博弈理论分析增加了世人对合作与冲突的理解”而共同获
得了 2005 年诺贝尔经济学奖。2007 年,赫维奇、马斯金以及迈尔森因为在创立和发展机制
设计理论方面做出了突出的贡献而获奖。2012 年,罗斯与沙普利因为在不同经济主体匹配
的研究方面做出了出色的贡献而获奖。
20 世纪 80 年代以来,博弈论得到了前所未有的发展,这一时期出现的比较有影响的人
物包括科瑞普斯、福德伯格、泰偌勒、罗宾斯坦以及威尔森等。在 20 世纪 90 年代末,已经
经济学的基础,史密斯也是 2002 年诺贝尔经济学奖得主之一。斯密斯和普利斯提出了演化
中的应用进行了广泛的探讨。
开始用博弈论来设计拍卖机制。史密斯设计了一个双向口头拍卖机制,这篇文章奠定了实验
稳定策略概念,对演化博弈理论的发展做出了突出的贡献;弗雷德曼则对演化博弈在经济学
(一)中国博弈论学科的发展历程
的第一篇论文
明
。中国的博弈论研究
[10-18]
性,在此基础上写了两篇有关非合作博弈的论文
二人零和博弈的极大极小定理是博弈论的基石,由冯·诺伊曼在 1928 年首先给出完整证
。上世纪 50-60 年代,中国博弈论的研究基本上处于起步阶段
[2]
开始于 50 年代吴文俊院士的工作,该定理是吴文俊理解博弈论的切入点,也是他研究的出
发点。1959 年初,吴文俊发表了他个人博弈论研究生涯,同时也是中国博弈论研究历史上
。吴文俊很早就意识到约翰·纳什在 50 年代从事的非合作博弈研究的重要
[10]
。尼古拉·沃比约夫教授是原苏联博弈
论的奠基人,他对于中国博弈论的诞生和成长也曾做出重要贡献,50 年代他应中国科学院
研究生。
“文革”十年间,中国博弈论的研究处于停滞状态,即使是数学家们也几乎听不到关于博
逐渐完善,并在经济学中发挥了至关重要的作用,合作博弈理论体系迅速形成。上世纪 80-90
[19-22]
对于博弈论在中国的经济、金融和管理科学领域的应用产生了重要而积极的作用。
[22]
的邀请来华讲授博弈论,受到周恩来总理的亲切接见,帮助中国培养了第一代博弈论领域的
弈论的任何消息。而这个时间恰好是国际博弈论迅速发展的关键时期,非合作均衡理论体系
年代,中国博弈论的研究进入到复苏阶段,但是这一时期的论著并不是十分丰富
[11,12]
,著作
本世纪的前十年,中国的博弈论研究领域呈现出繁荣景象,陆续出现了能够适应不同需
[23-25]
。2004 年国际动态博弈学会中国分会成立,2005 年中国运筹学会对策论
求层面的论著
专业委员会成立,在国际上有中国学者担任国际动态博弈学会执行理事等重要职位。学术交
流日趋活跃,在国内外特别是周边国家和地区的影响力逐渐显现,本领域的海外华人学者对
于国内举办的学术交流活动的支持和响应程度逐渐增强。2002 年“国际数学家大会‘对策论及
其应用’卫星会议”在青岛大学召开,纳什、泽尔滕、奥曼以及沙普利等四位诺贝尔经济学奖
得主同时出席会议。自 2004 年起,中国运筹学会对策论专业委员会已相继成功主持举办五
届学术年会“中国博弈论及其应用国际学术会议”。此外,2006 年协助组织举办了“第三届泛
太平洋博弈论大会”,2010 年全国博弈论与实验经济学研究会在北京成立并举办了“首届中
国博弈论与实验经济学学会年会”。
国内博弈理论研究与国际相比虽然起步稍晚,但是近年来的发展呈现出上升趋势。研究
团队目前主要分布于青岛大学、北京理工大学、贵州大学、西北工业大学、山东大学和中国
科学院等高校和科研院所。
(二)博弈论学科发展趋势展望
3
未来五年,随着网络时代的来临以及计算手段和能力的不断进步,博弈论学科将在进一
步完善基础理论体系的基础上,在算法博弈论、博弈论与互联网、博弈与社会科学、博弈与
可持续发展、不确定性与博弈等几个主要研究方向取得实质性的进展。本报告在下文中将围
绕这几个方向进行具体的阐述。
现有理论与实际应用的进一步完美结合。博弈理论与其他多学科理论的交叉、结合,将
产生新的研究分支,例如博弈理论与金融投资决策与分析的期权理论相结合,产生在不确定
性环境下的金融投资博弈模型及其理论分析框架;与经济和管理领域的行为理论、投资者异
质性理论相结合也将在理论和应用两个层面取得新的进展。
有限理性与行为假设和在此基础上进行的仿真及实验研究。人类的决策行为具有明显的
有限理性特征,基于完全理性假设的经典博弈理论难以预测或解释现实的经济管理系统中出
现的行为与现象。从有限理性假设、行为视角以及复杂性科学出发,并与其他学科有机结合,
并运用实验研究、现代仿真技术等手段与方法,研究行为主体之间的交互作用交互影响的特
征和机理、合作的演化及其规律,将成为博弈科学研究的一个重要发展趋势。
三、博弈论的主要研究方向
(一)博弈论的基础理论研究
1. 合作博弈与非合作博弈
截止到目前为止,博弈论体系中最为完善的组成部分是零和博弈,其在应用方面最著名
的例子是冷战时期美国和原苏联之间的军备竞赛以及著名的核遏制战略。纳什在上个世纪
50 年代初奠定了非合作博弈的基础,对非合作博弈论体系的建立做出了重大贡献。事实上,
因在“非合作博弈论中开创性的均衡分析”方面的杰出贡献,泽尔腾、海萨尼与纳什同时获得
1994 年诺贝尔经济学奖,他们的贡献涵盖了具有完全或不完全信息的静态、动态博弈的均
衡分析理论。
近二十年,纳什均衡以及非合作博弈理论成为研究的热点,合作博弈理论的发展迟滞大
致有以下三个原因。首先,大多数合作理论忽视了外部效应:联盟可能会被不属于这个联盟
的局中人的行动影响;其次,合作博弈论假设能够得到帕累托有效的结果;最后,合作博弈
认为会形成极大联盟。合作博弈的这些特性是存在问题的,因为在大多数经济学的应用环境
中外部效应是重要的,帕累托无效也会发生,而且极大联盟也可能不会形成。纳什曾经提议
本世纪初,十九位世界博弈论领域的权威学者接受采访,回答同样的五个问题,并对博
将合作与非合作理论统一起来,这就是著名的纳什仲裁方案,但它在应用上还没有产生太大
者应该得到更多重视。经典合作博弈主要关注多个局中人之间的联盟形成方式及联盟效用分
的影响。
弈论研究领域未来发展前景做出预测。有多位学者一致认为合作博弈论在 20 世纪被忽视或
配方案,即多人结盟合作博弈的解,在 20 世纪中叶有过较多的研究,提出了一些重要的多
博弈论的突出特征是局中人的完全理性假设以及理论体系的不完善,因而“合作博弈让人们
苦恼很长时间”。
人结盟合作博弈的解概念。目前多人合作博弈的发展明显滞后于多人非合作博弈,经典合作
在合作及非合作博弈理论方面,国内学者提出弱稳定集作为新一类合作博弈的解;针对
局中人在完全或部分合作条件下的扩展型合作博弈,通过设定合作函数刻画局中人选择个体
理性行为或合作行为的变化动态并建立完整的算法;针对合作微分博弈解的动态稳定性问
题,通过引入相应的分配补偿程序,建立动态稳定或强动态稳定的最优准则。专著
述研究工作做了系统的总结。针对图上博弈,在有限连通图上证明了简单策略以及 r-策略情
对上
[25]
4
形下绝对均衡的存在性定理并建立完整的算法
。针对集合博弈,提出了拟边缘贡献解等
[26]
几类分配方案;利用矩阵的方法,研究了多类合作博弈解的公理化理论;定义了新的区间运
[27-29]
。
算法则,提出了区间合作博弈单值解以及核心的概念;当联盟结构受限为图结构、拟阵结构、
稳定联盟结构时,利用解的相容性研究了合作博弈解的结构变化与特征
未来几年内,合作博弈论的进展将主要体现在以下几个方面:1)建立新的最优准则,
从而导致新的合作解;2)经典合作解在具有非完全合作特性、广义合作方式的博弈、微分
博弈以及 NTU 博弈模型中的扩展或变型;3)在局中人具有有限理性的合作博弈中合作解
的建立、存在性及其特性;4)经典合作解在动态合作博弈、图上博弈以及网络博弈中的运
用;5)运用公理化方法建立或研究合作解;6)经典合作解在社会、经济、管理领域模型中
的应用研究等。
2.网络博弈
网络博弈完全是在近二十年产生与发展起来的,针对网络博弈、网络生成和演化的动态
过程的研究是 20 世纪后期博弈理论领域具有重大突破的博弈论课题,其中网络生成博弈理
论是网络博弈领域中相对完善的组成部分。网络环境下的策略互动以及学习一般被认为是网
络演化的内因,内生或外生的网络结构表现出节点所代表的局中人之间的互动模式,局中人
之间的互动也是在该网络中信息流动和传播得以实现的载体。
上世纪 90 年代初,人们提出了网格上策略互动相关的概念,并对不同网络上的局部互
动和全局互动的异同进行了比较性研究。此后人们又对一般网络中基于协同博弈的互动进行
了研究,并对基于协同博弈的互动模型中个体的行动选择与邻居不同行动选择情况之间的关
系进行了深入的研究。在很多近期的研究工作中,互动邻居不再仅仅是局中人的直接邻居,
其邻居的邻居或者邻居的邻居的邻居也可能参与到与该局中人的互动过程。事实上,这类似
于经济网络中的行为主体既可能从他们的直接竞争对手处获得信息,又可以从那些与他们间
接相关的主体那里得到有关信息。
20 世纪末,人们开始研究网络环境下的模仿行为,相关工作重视区别信息结构和行为
准则,一般来说,模仿谁比如何模仿更重要。特别地,如果一个人模仿的是他的对手,那么
结果将变得非常具有竞争性;如果一个人模仿的是与自己面临同样问题,但与别的对手进行
对局的局中人,那么最终将得到纳什均衡。
近几年,人们开始研究模仿准则下有效行动的蔓延、互动博弈进程中网络与行动选择的
协同进化。此外,网络博弈研究领域中的非常有价值的研究课题还包括博弈论在解决网络安
全问题及一般冲突控制系统的优化问题中的应用。
国内针对网络博弈的研究处于起步阶段,在针对动态网络生成博弈、内生网络环境下的
策略互动以及网络环境下的学习理论的研究方面已取得初步进展;利用博弈理论,研究了无
线自组网的信息安全与激励机制
3.微分博弈
。
[30]
动态博弈和微分博弈是博弈理论领域中更为复杂但同时也是最具活力的研究领域之一,
其中相互竞争的各方在关于时间连续的进程中采取决策,并附加信息结构、不确定性以及预
先协商的可能性等假设。由于微分博弈模型中局中人决策相对于时间的连续性、对支付函数
所应满足条件的严格限制以及研究结果在除军事之外的其他领域长期没有得到有效的应用
等原因,微分博弈在过去甚至是现在都是一个颇具争议的研究领域。
微分博弈的起源可追溯到 20 世纪 40 年代,伊萨克为公认的微分博弈之父。微分博弈的
第一篇文献是伊萨克在兰德公司发表的。1951 年伊萨克发表了微分博弈的首篇论文,系统
5
研究了一个零和微分博弈及其解法。1965 年伊萨克发表《微分博弈》这部经典之作,它与
贝尔曼 1957 年发表的《动态规划》以及庞德里亚金 1962 年发表的《最优过程的数学理论》
论的结果求解微分博弈问题。1964 年伯克维奇将变分法应用于微分博弈,莱特曼和莫恩 1967
年研究了微分博弈的几何问题,1966 年庞德里亚金提出运用极大值原理解决微分博弈问题。
共同奠定了确定性微分博弈的理论基础。微分博弈领域中最初的研究成果是运用最优控制理
大体上,微分博弈可分为零和微分博弈和非零和微分博弈,亦可分为确定性微分博弈和
随机微分博弈。微分博弈的求解方法可分为三种:开环纳什均衡、闭环纳什均衡和反馈纳什
均衡。非零和确定性微分博弈开环均衡的求解最早见于伯克维奇 1964 年的工作,而非零和
确定性微分博弈的开环与反馈纳什均衡的研究最早见于凯斯1967 年和1969 年以及斯塔尔和
霍欧 1969 年的研究。
在微分博弈的解法中,开环解法相对于反馈解法是较易于分析处理和应用的,而反馈解
法虽然较为复杂,但却避免了时间一致性的问题。与确定性微分博弈相比,随机微分博弈是
属于更为复杂的决策情况。1969 年弗莱明求得了随机控制的解法,使得随机微分博弈能够
被分析。但由于动态演化与随机因素需要同时考虑,因此给出随机微分博弈的解法非常困难。
彼得罗相提出并解决了复杂冲突控制系统中的时间一致性问题,而关于合作随机微分博弈的
子博弈一致性的理论体系正是以此为基础
。
[31]
[20]
微分博弈领域的研究成果在各个学科领域以及数学的分支领域仍然不断涌现,特别的,
在经济以及管理科学领域中的应用研究发展迅速。著作
是国内最早出现的微分博弈专著。
近年来,国内学者在经济管理领域运用微分博弈理论也取得了一些可喜的进展,但总体上与
国际先进水平尚存在较大差距。
4. 机制设计
机制设计理论起源于赫尔维茨 1960 年和 1972 年的开创性工作
[32]
。它所讨论的一般问
题是,对于任意给定的一个经济或社会目标,在自由选择、自愿交换、信息不完全等分散化
决策条件下,能否设计以及怎样设计出一个经济机制,使经济活动参与者的个人利益和设计
者既定的目标一致。从研究路径和方法来看,与传统经济学在研究方法上把市场机制作为已
知,研究它能导致什么样的配置有所不同,机制设计理论把社会目标作为已知,试图寻找实
现既定社会目标的经济机制。即通过设计博弈的具体形式,在满足参与者各自条件约束的情
况下,使参与者在自利行为下选择的策略的相互作用能够让配置结果与预期目标相一致。
机制设计理论被认为是经济学中的“工程学”部分。机制设计者为了特定的目标或目的需
要一个机制或博弈以使所期待的目标出现在均衡中,即博弈是被选择的而不是给定的。近几
十年来,机制设计理论一直是现代经济学研究的核心主题之一,有众多经济学家在这个领域
做出了重要贡献,2007 年诺贝尔经济学奖授予赫尔维茨、马斯金以及迈尔森,以表彰他们
为“机制设计理论奠定了基础”。
5.演化博弈
演化博弈理论最早源于遗传生态学家对动物和植物的冲突与合作行为的博弈分析,他们
发现动植物演化结果在多数情况下都可以在不依赖任何理性假设的前提下用博弈论方法来
解释。但直到史密斯和普瑞斯 1973 年在他们发表的创造性论文中首次提出演化稳定策略概
念以后,才标志着演化博弈理论的正式诞生。生态学家泰勒和琼蔻 1978 年在考察生态演化
现象时首次提出了演化博弈理论的基本动态概念——模仿者动态,这是演化博弈理论的又一
次突破性发展。模仿者动态与演化稳定策略一起构成了演化博弈理论最核心的一对基本概
念,它们分别表征演化博弈的稳定状态和向这种稳定状态的动态收敛过程,演化稳定策略概
念的拓展和动态化构成了演化博弈论发展的主要内容。
6
在最初的演化稳定策略定义的基础上,为使其与现实更加接近,上个世纪九十年代多位
化博弈论的发展和应用研究成果显著,众多学者应用演化博弈论的理论研究了各种经济领域
学者针对不同群体和因素影响下的演化稳定策略概念进行了卓有成效的研究和理论拓展。另
一方面,20 世纪 80 年代以来,随着演化博弈理论在经济学领域中的引入,经济学领域中演
内的相关问题。进入 21 世纪以来,我国学者也开始关注演化博弈论,一些国内学者运用演
化博弈论理论和方法分析研究了相关领域内的具体问题。
6. 合作的演化
合作演化的问题严格的说不能算是纯粹的博弈问题。非合作博弈中合作行为的产生是一
个在近期受到众多学科关注并且具有重要发展潜力的前沿问题,博弈论在该领域应该扮演关
键的角色。当今世界面临很多紧迫的问题,如森林砍伐、过渡捕捞、气温变化,这些被称为
公共问题,这些问题的解决方案需要成百上千人的合作。然而如此大范围的合作,却被合作
困境所困扰。在每个人仅考虑个人兴趣的标准预测中,大部分合作是不实现的,因为具有搭
便车行为的人不可能在不考虑个人成本的情况下考虑公共利益。
合作演化研究手段主要包括实体实验和仿真实验两种,未来五年的研究重点是,在非合
作博弈的条件下,什么机制导致合作行为的出现?具体的研究课题大体上可以分成以下几个
方向:1)基于选择模式的研究;2)基于互惠机制理论的研究(包括直接互惠与简介互惠);
3)基于多行为主体的研究;4)基于空间结构的研究等。
7. 纳什均衡的稳定性与选取
纳什均衡是非合作博弈理论的核心概念。非合作博弈通常有多个纳什均衡,而且不同的
[34]
[4]
[12]
[33]
[35]
均衡点有不同的结果,如何选取更合理的纳什均衡一直是非合作博弈论的重要研究课题。博
弈论学者提出了多种均衡点的精炼概念,如泽尔腾
的完美均衡、迈尔森
的真均衡、科瑞
普斯和威尔森
均衡的本质连通区等。特别值得一提的是,1962 年吴文俊和江嘉禾从稳定性的研究出发,
的本质均衡、科尔伯格和梅腾斯
的序贯均衡、吴文俊和江嘉禾
的纳什
引入了本质均衡的概念,这是最早的纳什均衡的精炼概念。遗憾的是,由于本质均衡的要求
江嘉禾
[15]
太强,因而不能保证其存在性。吴文俊和江嘉禾证明了,大多数有限非合作博弈的纳什均衡
点都是本质的,且每个有限博弈都能被一列所有均衡都是本质的有限博弈来逼近。1963 年
合中都有一个本质连通区。
上世纪 90 年代以来,国内学者对具有一般策略空间和一般支付函数的非合作博弈模型
进一步引入了纳什均衡的本质连通区的概念,并证明了每个有限博弈的均衡点集
的纳什均衡点的选取进行了深入研究,得到了一系列深刻结果。这些研究工作从均衡点的稳
作问题构成的问题空间,大多数的博弈问题的均衡点都是本质的,进而证明了每个一般非合
定性出发,分别考虑支付函数或策略集的扰动以及两者同时扰动,引入本质纳什均衡点和纳
什均衡的本质集以及本质连通区的概念。从 1999 年开始,国内学者首先证明了对一般非合
。2002 年和 2004 年国内学者还对多目标博
[39]
对上述研究工作做了系统的总结。
弈证明了弱帕累托-纳什均衡点集中至少有一个本质连通区
[23-24]
作博弈的均衡点集中都存在一个本质连通区
结果,后来也被其他学者进行了推广
。这些结果推广了经典文献的
[36-38]
[40-41]
。两本专著
展望未来,纳什均衡的精炼仍然是非合作博弈理论的重要研究方向。除了进一步开展理
论研究,还需研究达成纳什均衡的过程。演化博弈论运用动力系统理论研究博弈过程中理性
行为,特别是有限理性行为与纳什均衡的关系,是研究达成纳什均衡的有效途径。特别是基
于纳什的博士学位论文中的质量-作用解释发展起来的群体博弈理论及其演化动力学能够更
论和应用方面取得深刻结果。
好地解释社会演化的过程。国内学者已开始对多目标群体博弈理论开展研究,期待能够在理
7
8.匹配与市场设计
2012 年,埃尔文·罗斯与劳埃德·沙普利因为在不同经济主体匹配的研究方面做出了出色
的贡献而获得诺贝尔经济学奖。他们的研究主题并不是传统意义上的经济问题,而更加关注
诸如学生录取、婚姻选择、器官移植等这类一般意义上不能引入价格机制的选择活动,这些
研究被涵盖在市场设计的主题之下。
市场设计问题被证明由于无法引入价格因素,而需人为地设计出一种算法或程序,以模
拟完全竞争市场的分配功能、满足自由参与和帕累托效率等几种福利性质,来实现稳定匹配
的目的。事实上,近二十年里市场设计领域在真实世界得到迅速的应用与创新,在全美住院
斯
医生匹配计划,新英格兰肾脏移植计划,以及各个大学的新生录取过程中,沙普利
、罗
以及他们的同行所找到的可以实现稳定匹配的算法被大量采用。这不但大大改善了之
关于匹配的算法方面,1962 年盖尔和沙普利在讨论男女婚姻组合和大学入学问题时提
[43]
前种种分配算法产生的福利缺陷,而且直接改善了参与计划者的自身福利。
出了双边匹配模型概念以及著名的盖尔-沙普利算法
[42]
市场功能也各不相同。
题。可以预见的是,2012 年诺贝尔经济学奖的结果将促进国内学者在未来几年给予该领域
以足够的重视。
涉及到的基本的匹配算法已经有十四种之多,这些算法所处理的问题都略有差异,其实现的
国内对于匹配理论虽然有所关注,但仅仅局限于在当前教育改革大背景下的学生录取问
。从目前的有关市场设计文献来看,
(二) 博弈论与互联网
这是一个随着互联网和移动网络崛起的新兴领域。互联网为人们彼此交流、参加社会经
济和群体活动提供了平台。研究的问题来自于互联网形成及市场设计、网络系统及虚拟社会
等。最初部分地借鉴经济学、运筹学和计算机科学的方法论描述、处理和解决这些问题。这
些工具在具体应用中的反复碰撞产生了新的定义、理论和工具,从而形成了这一领域的新研
究范式。博弈论中与互联网相关的主要研究领域包括:1)网络参与者相互作用基本原理;2)
群体智慧在大网络环境下的作用;3)互联网效用形成及市场设计原理;
中国学者积极参与了这一新兴领域的知识创造和研究,和国际的发展基本同步。在算法
原理研究方面,论文
提出了网络合作博弈中计算复杂性对合理解的重要性。论文
提出
了无政府比来量化个人优化与社会优化的矛盾。论文
应用多项式算法分析机制设计理论。
[44]
[47]
[50]
[54,55]
[51]
[56]
[58]
论文
提出了激励比的概念描述个体在均衡环境下个人有限理性。在群体智慧研究方面,
李彦宏首先运用群体智慧进行网页排名(同期还有相关论文
)。论文
应用算法原理研究
了网络流博弈中核存在的分析方法。论文
应用多数决定原则研究刻画了公共设施网络选
址问题。论文
提出了两个建造公用设施的算法机制。论文
应用整体优化分析了核电站
选址问题。社交网络系统延续了这一基本结构及原理,论文
应用社区生成博弈研究了社
会网络社区形成的原理。此外,论文
奠立了网络广告定价的广义第二价格协议的分析方
法。论文
提出了前瞻型均衡概念并用于跨网络市场套利原理。论文
应用多项式算法得
到广告市场均衡解。论文
针对买卖代理市场,得到最优拍卖及最优均衡解。论文
探讨
了网络广告买家的策略性行为。论文
进一步分析了买家应用联合策略的情况。
[60]
博弈论在互联网有着巨大的空间。除了对自利和理性的网络参与者分析之外,在统计行
为和博弈行为及集体知识挖掘的方法方面有着很好的前景。
(三)算法博弈论
8
[42]
[45]
[59]
[46]
[48]
[52]
[53]
[49]
[57]