博弈论学习笔记
博弈论学习笔记 一些概念 组合博弈(combinatorial games) 两个玩家,均可获得完全信息,每一操作均不受随机性影响(例如poker就不是组合博弈) 有偏博弈 两个玩家可以进行的操作有区别,例如象棋和跳棋 无偏博弈 两名选手交替对游戏进行移动,每次一步,选手可以在有限的合法移动集合中任选一种进行移动,双方均知道游戏的完整信息。 对于游戏的任何一种可能的局面,合法的移动集合只取决于这个局面本身,不取决于轮到哪名选手操作、以前的任何操作、骰子的点数或者其他因素。 如果轮到某名选手移动,且这个局面的合法的移动集合为空(也就是说此时无法进行移动),则这名选手负。 游戏中的同一个状态不可能多次抵达,游戏以玩家无法行动结束,且游戏一定会在有限步后以非平局结束,即状态图无环。 大部分的棋类游戏都不是公平组合游戏。 NIM游戏 有N堆石子,每堆石子的数量是 \(a_1,a_2,a_3,...,a_n\) ,合法的移动是”选择一堆石子并拿走若干颗(不能不拿)”,如果轮到某个人时所有的石子堆都已经被 拿空了 ,则 判负 (因为他此刻没有任何合法的移动)。 我们将图上的每一个局面看成图上的一个节点,所有的合法节点形成一个DAG。 P-position:先手必败 N-position:先手必胜 例如3堆石子的NIM游戏 (0,0,0)是必败局面。 (0,0,n)是必胜局面 (0,1,1