博弈

关于网络安全攻防演化博弈的研究小议

时光总嘲笑我的痴心妄想 提交于 2020-03-01 12:43:47
1. 拉高视角,从宏观看网络安全攻防 伴随着信息化的发展,网络安全的问题就一直日益突出,与此同时,网络安全技术也成为研究热点,直到今日也没有停止。 从微观来看,网络安全技术研究指的是针对某项或某几项指标的完善,例如: 针对WEB系统漏洞的挖掘和利用,以及与此相应的日志采集以及关键点审计技术,例如RASP和WAF,核心指标是精确率和召回率 恶意代码作者为了躲避病毒AV的静态和动态检测机制,通过隐写、混淆、多态等手段隐藏恶意代码的表征行为,与此对应的,病毒查杀厂商通过研究相应的反混淆、动态沙箱、插桩等技术,希望更有效地提取恶意代码的表征行为 在关注具体技术研究的同时,我们也需要意识到,网络安全策略的研究在某种程度上比技术研究更为重要,特别是对于同样的技术采用不同的安全策略会取得不同的效果。 网络安全中攻防对抗的本质可以抽象为攻防双方的策略依存性,而这种策略依存性正式博弈论的基本特征,因而可以考虑应用博弈论来解决网络安全攻防对抗的问题 。 在学术界,博弈论应用于网络安全处于发展阶段,相关的学术研究脉络有: 国外学者 Stakhanova 等人,通过随机博弈、不完全信息博弈等模型来进行入侵意图、目标和策略的推理 Reddy 指出关于入侵检测的研究主要且多数建立在一次性博弈分析的基础上 SHEN Shi-gen 认为考虑到真实场景中攻击的重复性,将其视为一个重复的多阶段博弈的过程显然更为合理

取石子游戏(博弈)

天大地大妈咪最大 提交于 2020-02-28 04:34:17
看来半天没想到竟然是这么屌丝,浪费了那么长的时间,证明完全NB,就靠我现在的智商想完全的独立的想出来完全没有可能 不过也“严重”说明了遇到这样困难的题目时,我们不应该轻言放弃。而应该仔细分析题目隐含的信息,学会分析和转化问题,从而找到问题的突破口,一举歼灭问题。 下面是转载的一篇详细的解释。。。 取石子游戏 Description 有两堆石子,数量任意,可以不同。游戏开始由两个人轮流取石子。游戏规定,每次有两种不同的取法,一是可以在任意的一堆中取走任意多的石子;二是可以在两堆中同时取走相同数量的石子。最后把石子全部取完者为胜者。现在给出初始的两堆石子的数目,如果轮到你先取,假设双方都采取最好的策略,问最后你是胜者还是败者。 Input 输入包含若干行,表示若干种石子的初始情况,其中每一行包含两个非负整数a和b,表示两堆石子的数目,a和b都不大于1,000,000,000。 Output 输出对应也有若干行,每行包含一个数字1或0,如果最后你是胜者,则为1,反之,则为0。 Sample Input 2 1 8 4 4 7 Sample Output 0 1 0 Source NOI 转载分析:大致看完题目,想当然就知道这是一道博弈论的问题,最容易想的就是直接用博弈论的必败、必胜态进行动态规划求解。但是朴素的动态规划是 O(N * M) 的,如果做一些优化可能可以过掉 RQNOJ

信息博弈、凡勃仑效应

拟墨画扇 提交于 2020-02-02 09:56:36
想卖出产品,为什么需要提高售价而不是降低呢? 在08年全球金融危机时,房地产行业遭遇滑铁卢,房地产商不断降价以提升销售量,但是有这么一家房地产公司,没有降价,反而涨价,并打出了“每天限购5套房子”,然而,自从出了这个政策,这家公司,每天都能保证5套房子顺利卖出,过了两三天,反而买房者蜂拥而至,需要摇号才可以有购买的机会。 那么,这是什么原因呢?最简单的解读就是通过抬价来提高“身份”,让消费者误以为自己比同行的产品更优质,就这件事本身来看,这个房产商的做法在适当的隐藏信息和限制信息,让民众在博弈中处于被动位置,误以为“是不是这家公司的房屋质量高?成本高以至于本身就无法同别的房产一样大幅降价”“是不是金融危机快结束了?”“是不是这个房子供不应求,所以才出这种政策?”自然,这种现象也就不足为奇了。 信息博弈 :其实,在奢侈品市场一直尊崇着这一定理,即使300元无人问津的包,标价到3w元,都会被人抢购;亦或者是饥饿营销,联名款,限量版,都是这一原理,为了彰显这个产品甚至品牌的与众不同,控制销量,提高售价,都会因其信息的不对等,总会有消费者为期买单。 凡勃仑效应 :商品价格定得越高越能畅销。它是指消费者对一种商品需求的程度因其标价较高而不是较低而增加。它反映了人们进行挥霍性消费的心理愿望。 措施 :作为卖家,制造信息差异,误导买家,另一方面,造成凡勃仑效应,影响买家行为,但是

机器学习(三十九)——博弈论(2), Exploration & Exploitation

北城余情 提交于 2020-01-13 08:19:16
博弈论 智猪博弈问题 智猪博弈问题是John Nash于1950年提出的问题。 在一个猪圈里养着一头大猪和一头小猪,在猪圈的一端放有一个猪食槽,在另一端安装有一个按钮,它控制着猪食的供应量。假定: 猪按一下按钮,就有8单位猪食进槽,但谁按按钮就会首先付出2单位成本; 若大猪先到食槽,则大猪吃到7单位食物,而小猪仅能吃到1单位食物; 若小猪先到,则大猪和小猪各吃到4单位食物; 若两猪同时到,则大猪吃到5单位,小猪仅吃到3单位。 显然,在这里按按钮有两个成本: 直接成本:2单位成本。 间接成本:先按按钮的猪,肯定会最后到达食槽。 因此,这个问题写成策略矩阵,则是: 小猪 按 等待 大猪 按 3,1 2,4 等待 7,-1 0,0 该博弈不存在占优战略均衡,因为尽管小猪有一个严格占优战略,但大猪并没有占优战略。 为了解决这个问题,Nash提出了重复剔除的占优战略均衡(iterated dominance equilibrium)。 其具体做法如下: Step 1 :大猪没有劣战略,策略保持不变。 Step 2 :小猪有一个劣战略: “按”。 “按”的支付值: 1, -1 “等待”的支付值: 4, 0 Step 3 :剔除小猪的劣战略“按”。 Step 4 :剔除之后,大猪有一个劣战略:“等待”。 Step 5 :剔除大猪的劣战略“等待”,剩下最后一个战略组合: 大猪:“按” + 小猪:

博弈 习题-田忌赛马问题

大城市里の小女人 提交于 2019-12-29 20:26:41
问题描述: 田忌赛马:田忌和齐王赛马,每人有上、中、下三个等级的马各一匹,上等马优于 中等马,中等马优于下等马,同一等级的马中齐王的马优于田忌的马。比赛共进行 三局,每匹马只能参加一局比赛,每局的胜者得1分,负者得-1分,比赛结果为三 局得分之和。 (1)写出这场博弈中的 局中人 、 策略集合 和 效用矩阵 (2)请给出田忌赛马的 任意一种混合策略纳什均衡解 ,并计算此时双方的期望得分 解答: 来源: CSDN 作者: 敲代码的乔帮主 链接: https://blog.csdn.net/Suyebiubiu/article/details/103754924

计算社会学——博弈

自作多情 提交于 2019-12-03 02:15:21
博弈 博弈三要素 参与人(player,玩家) 策略集(strategy,战略) 回报(payoff,收益,支付) 每个参与人有一个策略集 策略组:每个参与人出一个策略构成的策略组合 对应每个策略组,每个参与人有一个回报 博弈的目标:收益而非输赢(博弈存在共赢) 简单博弈理论的基本假设: 理性人”:能够做出最优判断 “规则透明”:互相了解对方策略集(不一定了解行动) “自我利益最大化”:参与人目标是个人利益的最大化 博弈的结果:均衡 均衡:在这个策略组下,任何参与人都没有改变的动机。 严格最佳应对:如果你这么做,我最好选择这样做 严格占优策略:不管你怎么做,我都最好选择这样做 博弈中只需一方存在严格占优策略时,结果即可预测。(一方选择严格占优策略,另一方选择对方严格占优策略的严格最佳应对) -如果双方都没有严格占优策略呢? 一对互为 严格最佳应对 的策略组,是一个纳什均衡,因为没有人会愿意改变。 存在多个纳什均衡的博弈称为“协调博弈”。博弈的结果一般难以从博弈结构中预测,往往需要额外的信息。例如习俗,习惯,包括双方的协调约定。 对应每个策略组,每个参与人有一个回报 来源: https://www.cnblogs.com/obob/p/11770888.html

【尼姆博弈】POJ2234

折月煮酒 提交于 2019-11-28 01:27:01
题目链接: http://poj.org/problem?id=2234 Bouton定理 :先手能够在非平衡尼姆博弈中取胜,而后手能够在平衡的尼姆博弈中取胜。 #include<iostream> using namespace std; int main() { int n; while(cin>>n) { int ans=0,a; for(int i=1;i<=n;i++) { cin>>a; ans^=a; } if(ans==0) cout<<"No"<<endl; else cout<<"Yes"<<endl; } return 0; } 来源: https://blog.csdn.net/weixin_42146061/article/details/99884135

《博弈论的诡计》

 ̄綄美尐妖づ 提交于 2019-11-28 00:26:47
"吠犬不咬人" 对这个世界的最好描述可能只有其本身。 囚徒困境: 下下人有上上之智。 根据情况可列写 博弈收益矩阵, 太精明往往会坏事哦, 精明不等于高明 哦。 重复博弈: 在车站这样人群流动性大的地方,不但商品和服务质量差,而且假货横行。 对未来的预期是我们行为的重要因素。 每一次的人际交往其实都可以简化为两种基本选择: 合作还是背叛 。在人际交往中普遍存在囚徒困境:双方明知合作带来双赢,但 理性的自私和信任的缺乏导致合作难以产生。而且,如果博弈是一次性的,那么这必然加剧双方进行坦白的决心,选择相互背叛。 车站边的饭店销售特点:尽量谋取暴利并且带有欺骗性。 深谙策略思维者懂得瞻前顾后,避免失足于最后一一步。 在现实世界中,所有真实的博弈只会反复进行有限次。 要想避免信任瓦解,千万不能让任何确定无疑的最后一轮出现在 视野所及的地方 。只要仍然存在继续合作的机会,背叛就会被抑制。 但是多数人都没有那么多善良,而是按照自己的理性行事。 个人可以完全按照自己利益最大化的目标进行决策。 背叛显然就是唯一理性的选择。 人们通过接受及回报,形成了社会生活的秩序。 比赛过程就是对手相互学习的过程。 友谊并不是合作的必要条件。 合适的策略也能达成并保证合作。 超越理性的:如果有人打你的左脸,你应把右脸也让他打。 zerosum game(零和博弈): 双方各自输赢的总和(支付,Payoff):