博弈论

博弈论 -- 巴什博弈

匿名 (未验证) 提交于 2019-12-02 23:45:01
参考文献: https://wiki.mbalib.com/wiki/%E5%8D%9A%E5%BC%88%E8%AE%BA 《博弈策略》 前言:   什么是博弈论?古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争 赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们 “出棋” 着数中理性化、逻辑化的部分,并将其系统化为一门科学。换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。事实上,博弈论正是衍生于古 老的游戏或曰博弈如象棋、扑克等。数学家们将具体的问题抽象化,通过建立自完备的逻辑框架、体系研究其规律及变化。这可不是件容易的事情,以最简单的二人 对弈为例,稍想一下便知此中大有玄妙:若假设双方都精确地记得自己和对手的每一步棋且都是最“理性” 的棋手,甲出子的时候,为了赢棋,得仔细考虑乙的想法,而乙出子时也得考虑甲的想法,所以甲还得想到乙在想他的想法,乙当然也知道甲想到了他在想甲的想 法…   面对如许重重迷雾,博弈论怎样着手分析解决问题,怎样对作为现实归纳的抽象数学问题求出最优解、从而为在理论上指导实践提供可能性呢?   通过博弈论的学习, 希望也能够提升自己解决问题的能力和决策力,博弈论是一门很深的学问, 也不是看几本书就能够掌握的,正所谓高山仰止

Nim游戏题解(博弈论入门基础)

为君一笑 提交于 2019-12-02 06:39:57
博弈论 这真的是很神奇呢 注:这里引用了大量他人的博客,再次不一一说明,主要是为了学习 定义 博弈论又被称为对策论(Game Theory)既是现代数学的一个新分支,也是运筹学的一个重要学科。 博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。 博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。 博弈论已经成为经济学的标准分析工具之一。在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。 基本概念中包括局中人、行动、信息、策略、收益、均衡和结果等。其中局中人、策略和收益是最基本要素。局中人、行动和结果被统称为博弈规则。 其实这里没有什么用 引入 我们就用鼎鼎大名的Nim游戏来进行讲解 Nim游戏-传送门 那我现在就进行简单的说明吧 我会尽量用通俗易懂的话来说明 题目大意: 总有n堆石子,每堆有若干个石子 从A开始每次轮流从一堆石子中抽出若干个(可以全抽) 但是不能不拿 要不然没完没了。。。 看最后轮到谁没有石子可以抽,那么他就输了 并且两个人都聪明绝顶 解析: 我们可以先手模一下发现 如果只有一堆那么先手一定赢 如果剩下两堆不相等的石子,必胜策略是通过取多的一堆的石子将两堆石子变得相等,以后如果对手在某一堆里拿若干颗

通过几个例子理解博弈论与纳什均衡

旧时模样 提交于 2019-12-02 02:08:19
转载自知乎 https://zhuanlan.zhihu.com/p/25781797 喜欢玩德州扑克的人应该都听说过“GTO”这个词。GTO,即 GameTheory Optimal,翻译成中文应该叫做“游戏理论最优化”。直接翻译过来有点拗口,通俗一点的解释可以是:在游戏中,你可以采取一种最优策略,使得自己的损失最小,同时游戏中的对手也必须采取相对应的策略,否则只会扩大你的受益。 讲到GTO,就不得不提到博弈论中非常著名的一个理论:纳什均衡(Nash Equilibrium)。该理论是由著名的经济学家,博弈论创始人,诺贝尔奖获得者约翰·纳什提出的,也就是电影《美丽心灵》的男主角原型。该理论是说:在非合作类博弈中,存在一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。如果参与者当前选择的策略形成了“纳什均衡”,那么对于任何一位参与者来说,单方更改自己的策略不会带来任何好处。 约翰·纳什证明了在每个参与者都只有有限种策略选择,并允许混合策略的前提下,纳什均衡一定存在。上边的解释还是有点拗口,这里通过几个例子,更直观的理解一下这个理论。 囚犯的困境 假设有两个小偷A和B联手闯入民宅盗窃被抓,警方将两人置于不同的房间进行审讯,并给出如下政策:如果一个犯罪嫌疑人坦白并交出了赃物,两人都会被判有罪。如果另一个犯罪嫌疑人也坦白,则两人各被判刑8年;如果另一个犯罪嫌人抵赖

浅谈博弈论

只谈情不闲聊 提交于 2019-12-01 13:23:46
引言 在生活中五子棋也是一种先手有必赢策略的游戏,有人会说五子棋先手我也会输啊,所以 博弈论问题都有个类似如“参与者足够聪明”,“两人都不犯错"的前提。 在此前提下,讨论几种常见的 博弈情形 一:巴什博弈 问题描述:n个物品,两个人轮流取[1,m]个,最后取光者胜利,判断先手胜还是后手胜? ​ 分析 考虑到 若 n=m+1 那么 第一个人不论如何取都不能取胜 。 ​ 进一步我们发现 若 **n=k*(m+1)+r ; 先取者拿走 r 个 ,那么后者再拿 [1,m]**个 ​ **n=(k-1)*(m+1)+s ; 先取者再拿走s 个 最后 总能造成 剩下n=m+1** 的局面。 ​ 因此,此时 先手有必赢 策略。 ​ 相对应的,若**n=k*(m+1) 那么先取者必输**。 二:尼姆博弈(Nimm Game) 问题描述:n堆物品,第i堆有ai个,两个人轮流选择一堆,并从中选取走[1,ai]个,最后取光者胜利,判断先手胜利还是后手胜利? 分析: 先说点别的: N必胜状态,P必败状态 N一定是从P转移过来的,P一定不能从N转移过来 (但可能p的后继状态里有N,只是不会转移过去) 为什么呢? 比如说,你现在处于优势,你不可能把你再陷入劣势 你现在处于劣势,你肯定要想尽方法把你带进优势 Nim游戏有个定理 先手必胜,当且仅当 a1 xor a2 xor a3 xor.....xor an

博弈论

风流意气都作罢 提交于 2019-11-28 08:18:35
博弈论入门 什么是博弈论 博弈论是指双方或多方在竞争、合作、冲突等情况下,充分了解各方信息,并以此选择一种能为本方争取最大利益的最优决策的理论。 博弈论四个要素: 最少有两个参与者 利益 策略 信息 博弈论的结果划分: 负和博弈: 博弈的所有参与者最后得到的收获都小于付出,都没有占到便宜,是一种两败俱伤的博弈。 零和博弈: 参与者一方获益,另一方出现损失,参与者之间的收益和损失之和为零。 正和博弈: 双赢博弈,参与者的多方都获得了对应的收益,也是博弈最好的结果,也是最好的一种博弈。 著名的囚徒困境的问题在于他们没有选择对两人来说最优的策略,而是选择对自己最优的策略,根本原因在于双方被隔离审讯,无法掌握对方的信息,所以看似每个人都作出了对自己最有利的策略,结果却是两败俱伤。 田忌赛马是典型的对掌握的信息调整对应的策略。 原有是上对上,中对中,下对下,三局两胜。 调整策略后,下对上,中对下,上对中。 一个能争取最大利益的策略,也就是最优策略。 博弈用来比喻为了利益进行竞争。 博弈论是硬系统的理论,属于应用数学的一个分支。 即了解充分的信息,做出最优策略。 博弈作为一种争取利益的竞争。 博弈论的发展过程:古代(孙子兵法) à 近代(冯 · 诺依曼) à 现代(约翰 · 福布斯 · 纳什) 经济史上三次伟大的革命:边际分析革命 à 凯恩斯革命 à 博弈论革命。 博弈论就是在一定情况下

【精选】博弈论第一弹

拟墨画扇 提交于 2019-11-26 14:06:57
博弈论又被称为对策论(Game Theory),既是现代数学的一个新分支,也是运筹学的一个重要学科。学习博弈论,可以指导我们这个充满竞争的世界中,我们要怎么做才能让自己(或者自己的集体)利益最大化。 (摘自:百度百科) 博弈时往往有三种结果:负和博弈、零和博弈与正和博弈,用通俗的话解释就是两败俱伤、一方获利一方亏损和双赢。正和博弈当然是最好的结果,但是往往无法达成。 博弈论有很多的种类,我们介绍其中的几种。 一. 囚徒博弈论——为何走向穷途末路? 有一个广为流传的故事:两个罪犯甲、乙入室盗窃并将屋子的主人杀害,被捕后分别审讯,他们都只承认盗窃罪,不承认故意杀人罪,这样他们都会被判处1年有期徒刑。这似乎对他们来说是最好的情况,但是后来他们却纷纷承认故意杀人罪,为什么呢? 原因很简单:他们是分开审讯的。 假设盗窃罪判刑1年,故意杀人罪判刑8年,被别人揭穿会加刑1年,坦白减刑2年,那么就可以绘制一个简易的博弈论模型: 图真是太不美了(●—●) 明明可以少坐6年牢,为什么要招供呢?不妨从甲和乙的角度来考虑:由于不知道对方的消息,甲会认为,我不知道能不能相信乙,万一他先招供了,我就会坐10年的牢,为了不引起最坏的后果,还能够释放,我必须先招认!同样的,乙的想法和甲类似,再加上警察煽风点火,于是便纷纷招供,最后的结果是两人一起坐7年的牢。 这就呈现了所谓博弈论中的“纳什均衡”

博弈论

随声附和 提交于 2019-11-26 10:23:45
1、巴什博弈 2、威佐夫博弈 3、尼姆博弈 来源: https://www.cnblogs.com/nonames/p/11317890.html