博弈论
湖南师范大学
罗迅
博弈论(Game Theory)
n 《孙子兵法》
n 冯·诺依曼
n 约翰·纳什
囚徒困境
n A、B两个嫌疑人分别单独接受审讯
n 其中一个坦白,而另一个抵赖,则坦白人释放,抵赖者判刑10年
n 双方都坦白,均判刑8年
n 双方都抵赖,由于没有其他证据以证明更严重的罪行,双方均判刑2
年
合作案例
n 100个参会人,1个主持人
n 每个参会人分别单独的缴纳一定的会费
n 如果总会费超过499元,则主持人将向每参会人返还6元
n 如果总会费未超过499元,则全部归公,一分不还
n 这是一个有趣的实验,有条件可以做一下
ACM之博弈问题
n POJ1085
n 双方轮流连线
n 如果能够完成一个三角形,则再走一步
n 给定残局,问,谁能获胜
n 动态规划
博弈论题目的一般性想法
n 首先,双方都是高手且理性
n每一步都全局最优
n即使输,也要走全局最优,使得输得最少
n 动态规划——每个局面,唯一确定一个状态
n局面可以是不同初始条件的开局
n也可以是同一初始下不同的残局
博弈题目的一般性想法
n 令胜负结果是一个整数分值,双方得分高者获胜
n 站在先手角度,每一步都希望得到最大分
n 站在后手角度,每一步都希望对方得到最小分
n 显然,你不能只考虑一步或者两步
最大最小值函数