博弈论 第3讲

博弈论 第3讲
预览:

博 弈 论 讲 义 完 全 信 息 静 态 博 弈

囚徒困境的扩展分析
囚徒困境问题引发了相当多学者的关注
Economists, psychologists, sociologists, biologists

——

对囚徒困境问题的另一个相关著名事件 就是有关的试验分析方法。

博 弈 论 讲 义 完 全 信 息 静 态 博 弈

囚徒困境的实验
试验往往考虑重复进行(多轮囚徒博弈)
对手保持不变(亦可随机匹配对手)
某文献提供的一个证据:50%~94%选择坦 白;在倒数10~20轮中,78%选择了坦白; 允许双方交流情况下,坦白策略出现的频 率变小(29%~70%)

——

博 弈 论 讲 义 完 全 信 息 静 态 博 弈

Robert Axelrod 的著名实验
进行多轮囚徒博弈(重复博弈),采用巡回赛方 式
事先让参赛者给出预定策略 累计最终得分 第一次参赛有15种战略(来自经济学、心理 学、社会学、政治学和数学领域学者),还 有一个随机决定“坦白”、“不坦白”的随 机战略 结果一个叫“tit for tat‖的策略获胜

——

博 弈 论 讲 义 完 全 信 息 静 态 博 弈

Robert Axelrod 的著名实验
“tit for tat”的含义:以合作开始,然后“克隆” 对方上一步的策略。
Axelrod公布了公布了这个结果,并进行了第 二次巡回赛
来自6个国家63个程序参赛

——

Tit or tat 再次获胜

阿氏研究发表在《科学》上,并获得了年度 大奖(名称待查)

博 弈 论 讲 义 完 全 信 息 静 态 博 弈

重复剔除严劣策略均衡
前面介绍了第一均衡概念——占优均衡
(显然)并非所有博弈都存在占优均衡, 如石头、剪子、布游戏 对占优均衡概念稍加扩展,就得到重复 剔除严劣策略均衡概念

——

博 弈 论 讲 义 完 全 信 息 静 态 博 弈

重复剔除严劣策略均衡
―严劣”和“弱劣”的含义:
 设 si’和si’’是参与人i可选择的两个策略, 若对其他参与人的任意策略组合s-i, 均成立 ui(si’, s-i) < ui(si’’, s-i), 则说策略si’严劣于策略si’’ 。 上面式子中,若将“<‖改为“≤”,则说策 略si’弱劣于策略si’’ 。

——

博 弈 论 讲 义 完 全 信 息 静 态 博 弈

重复剔除严劣策略均衡
重复剔除严劣策略均衡的定义
重复剔除严格策略就是各参与人在其各自 策略集中,不断剔除严劣策略… 如果最终各参与人仅剩下一个策略,则该 策略组合就被称为重复剔除严劣策略均衡。

——

博 弈 论 讲 义 完 全 信 息 静 态 博 弈

重复剔除严劣策略均衡
实例 一个虚拟的博弈,见图1-4。
该博弈不存在占优均衡。
参 与 人 上 参 与 人 2 左 1, 0 0, 4 图 1-4 中 1, 3 0, 2 右 0, 1 2, 0

——

1



博 弈 论 讲 义 完 全 信 息 静 态 博 弈

重复剔除严

第1页/共123页 下一页>尾页

寻找更多 "博弈论 第3讲"