读书笔记: 博弈论导论 - 11 - 完整信息的动态博弈 战略协议
战略协议(Strategic Bargaining)
本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。
协议是多方对一个剩余(surplus),通过提议,尝试达成一致意见。
一个两人协议博弈的过程:
- 第一回合
- 玩家1提出分配$(x, 1-x)$,玩家1得到x,玩家2得到1-x。
- 如果玩家2表示接受,博弈结束,$v_1 = x, v_2 = 1-x$。如果玩家2反对,进入下一轮
- 第二回合
- 剩余变成了$1 - \delta$。折扣率$0 < \delta < 1$
- 玩家2提出分配$(x, 1-x)$,玩家1得到x,玩家2得到1-x。
- 如果玩家1表示接受,博弈结束,$v_1 = \delta x, v_2 = \delta (1-x)$。如果玩家1反对,进入下一轮。
- 第三回合及以后
- 博弈如上继续,在奇数回合,玩家2的反对则导致其在下一轮变成提议者,反之亦然。
- 每个回合的继续,到导致剩余的一次折扣,在第t个回合,剩余未$\delta^{t-1}$。
协议博弈和之前博弈的不同之处:
- 如果提议被接受,博弈会在任何回合结束。
- 收益只有在整个博弈结束时才产生,而不是每个回合就会产生。
只有一轮的协议:最后的话博弈(The ultimatum game)
take it or leave it. 推论:11.1
在一个T=1的协议博弈中,剩余的任何分配都能被支持为一个纳什博弈:$x^* \in [0, 1], (v_1, v_2) = (x^, 1 - x^)$. 推论:11.2 在一个T=1的协议博弈中,允许一个唯一的子博弈精炼均衡,在这个均衡中,玩家1提供$x=1$,并且玩家2接受任何$x \leq 1$。
有限回合的协议博弈
推论:11.3
任何子博弈精炼均衡必定导致玩家们可以在第一回合达成一致。 两人奇数回合的协议博弈的结果 $$ v_1^* = x_1 = \frac{1 + \delta^T}{1 + \delta} \ and \ v_2^* = (1 - x_1) = \frac{\delta - \delta^T}{1 + \delta} \ \lim_{T \to \infty} v_1^* = \lim_{T \to \infty} \frac{1 + \delta^T}{1 + \delta} = \frac{1}{ 1 + \delta} \ \lim_{T \to \infty} v_2^* = \lim_{T \to \infty} \frac{\delta - \delta^T}{1 + \delta} = \frac{\delta}{1 + \delta} \ \lim_{\delta \to 1} \lim_{T \to \infty} v_1^* = \lim_{\delta \to 1} \frac{1}{1 + \delta} = \frac{1}{2} \ \lim_{\delta \to 1} \lim_{T \to \infty} v_2^* = \lim_{\delta \to 1} \frac{\delta}{1 + \delta} = \frac{1}{2} \ $$
说明了
- 玩家1拥有last-mover take-it-or-leave-it 优势和 first-mover折扣优势,意味着: $v_1^* > v_2^*$。
- 如果玩家都是有耐性的(也就是说不接受达到自己最低要求的提议),则last-mover take-it-or-leave-it优势消失了。
- 长期的回合消除了last-mover take-it-or-leave-it优势。
- $\delta = 1$消除了first-mover优势。
无限回合的协议博弈
两人无限回合的协议博弈的结果 $$ \overline{v}_1 = \overline{v}_2 = \overline{v} \ \underline{v}_1 = \underline{v}_2 = \underline{v} \ \underline{v} = 1 - \delta \overline{v} \ \overline{v} = 1 - \delta \underline{v} \ \underline{v} = \overline{v} = \frac{1}{1 + \delta} \ where \ \overline{v} \text{ : the best subgame-perfect equilibrium} \ \underline{v} \text{ : the worst subgame-perfect equilibrium} \ $$
协议立法
封闭规则协议(Closed-Rule Bargaining)
博弈规则:
有N奇数个玩家,需要$\frac{N+1}{2}$个接受才能是提议通过。 在每个周期里,每个玩家都有相同的可能性称为提议者。 博弈结果: $$ where \ k \text{ : the proposer's best response} \ v \text{ : the expected payoff for any player i} $$
提议者的最佳收益:需要得到n-1的人的同意,由于折扣优势,这个n-1个人的收益为$\delta v$: $$ k = 1 - \frac{N - 1}{2} \delta v \ $$ 回应者的收益:有$\frac{1}{N}$可能性成为提议者,拿到k; 有$\frac{N - 1}{N}$的可能性成为回应者,并且只有$\frac{1}{2}$的可能性(因为提议者只提供收益给回应者中的一半人)拿到$\delta v$。 $$ v = \frac{k}{N} + \frac{N - 1}{2N} \delta v \ $$
计算结果: $$ v = \frac{1}{N} \ k(N) = 1 - \delta ( \frac{N - 1}{2N}) \ $$
说明了
- 当回扣率增加,提议者的收益变少。
- 玩家越多,提议者收益越大,回应者收益越少。
开放规则协议(Opened-Rule Bargaining)
博弈规则:
有N奇数个玩家。 提议者提出一个协议, 有一个修订者提出一个修改协议。 如果提议者的协议通过了$\frac{N+1}{2}$。则被接受。 否则,修改协议变成主协议。 一个新的修订者提出一个修改协议。 再次投票,重复上面的过程。
保证方案(guaranteed success)
无论那个响应者成为修订者,都可通过的方案。 案例:3个玩家。 $$ where \ k \text{ : the proposer's best response} \ v(k) \text{ : the expected payoff for any player i} $$
回应者的收益:一方面为$\frac{1 - k}{2}$,一方面为$\delta v(k)$: $$ \frac{1 - k}{2} = \delta v(k) \ $$ 修订者的收益:由于对称性,修订者的给自己的收益$v(k)$应该是k。 $$ v(k) = k \ $$
计算结果: $$ k = \frac{1}{1 + 2 \delta} \ $$
说明了
- 玩家越有耐心,提议者的付出越多。
- 封闭规则对提议者有利。
冒险方案(risky success)
冒一个部分响应者不会成为修订者的风险。 $$ where \ k \text{ : the proposer's value to himself} \ v(k) \text{ : the expected payoff for proposer} \ v(0) \text{ : the expected payoff for the player who will be offered 0} $$
回应者的收益:一方面为$1 - k$,一方面为$\delta v(k)$: $$ 1 - k = \delta v(k) $$ 提议者的期望收益:有$\frac{1}{2}$可能性拿到k;如果冒险失败,有$\frac{1}{2}$可能性拿到v(0)。 $$ v(k) = \frac{1}{2} k + \frac{1}{2} \delta v(0) \ $$ 得到0的玩家的期望收益:有一半的可能性得到v(k)。 $$ v(0) = \frac{1}{2} \delta v(k) \ $$
计算结果: $$ k = \frac{4 - \delta^2}{4 + 2 \delta - \delta^2} \ v(k) = \frac{2}{4 + 2 \delta - \delta^2} \ $$
说明了
- 当$\delta > \sqrt{3} - 1$时,冒险方案更好。
参照
- Game Theory An Introduction (by Steven Tadelis)
- 读书笔记: 博弈论导论 - 01 - 单人决策问题
- 读书笔记: 博弈论导论 - 02 - 引入不确定性和时间
- 读书笔记: 博弈论导论 - 03 - 完整信息的静态博弈 预备知识
- 读书笔记: 博弈论导论 - 04 - 完整信息的静态博弈 理性和公共知识
- 读书笔记: 博弈论导论 - 05 - 完整信息的静态博弈 纳什均衡
- 读书笔记: 博弈论导论 - 06 - 完整信息的静态博弈 混合的策略
- 读书笔记: 博弈论导论 - 07 - 完整信息的动态博弈 预备知识
- 读书笔记: 博弈论导论 - 08 - 完整信息的动态博弈 可信性和序贯理性
- 读书笔记: 博弈论导论 - 09 - 完整信息的动态博弈 多阶段博弈
- 读书笔记: 博弈论导论 - 10 - 完整信息的动态博弈 重复的博弈
- Nash bargaining solution
来源:oschina
链接:https://my.oschina.net/u/4375533/blog/4205767