蒙特卡罗模型

蒙特卡罗方法入门

半腔热情 提交于 2020-02-25 12:49:56
本文通过五个例子,介绍蒙特卡罗方法(Monte Carlo Method)。 一、概述 蒙特卡罗方法是一种计算方法。原理是通过大量随机样本,去了解一个系统,进而得到所要计算的值。 它非常强大和灵活,又相当简单易懂,很容易实现。对于许多问题来说,它往往是最简单的计算方法,有时甚至是唯一可行的方法。 它诞生于上个世纪40年代美国的"曼哈顿计划",名字来源于赌城蒙特卡罗,象征概率。 思路:首先产生大量随机样本,观察样本的分布情况,从中总结出一般规律,可以推算出问题的近似解。 二、圆周率 π 的计算 第一个例子是,如何用蒙特卡罗方法计算圆周率 π 。 正方形内部有一个相切的圆,它们的面积之比是 π /4。 现在,在这个正方形内部,随机产生10000个点(即10000个坐标对 (x, y)),计算它们与中心点的距离,从而判断是否落在圆的内部。 如果这些点均匀分布,那么圆内的点应该占到所有点的 π/4,因此将这个比值乘以4,就是 π 的值。通过R语言脚本随机模拟30000个点, π 的估算值与真实值相差0.07%。 三、积分的计算 上面的方法加以推广,就可以计算任意一个积分的值。 比如,计算函数 y = x 2 在 [0, 1] 区间的积分,就是求出下图红色部分的面积。 这个函数在 (1,1) 点的取值为1,所以整个红色区域在一个面积为1的正方形里面。在该正方形内部,产生大量随机点

Monte carlo

落花浮王杯 提交于 2020-02-22 09:19:50
转载 http://blog.sciencenet.cn/blog-324394-292355.html 蒙特卡罗(Monte Carlo)方法,也称为计算机随机模拟方法,是一种基于"随机数"的计算方法。 1、起源 这一方法源于美国在第二次世界大战进研制原子弹的"曼哈顿计划"。Monte Carlo方法创始人主要是这四位:Stanislaw Marcin Ulam, Enrico Fermi, John von Neumann(学计算机的肯定都认识这个牛人吧)和 Nicholas Metropolis。 蒙特卡罗方法的名字来源于摩纳哥的一个城市蒙地卡罗,该城市以赌博业闻名,而蒙特·罗方法正是以概率为基础的方法。与它对应的是确定性算法。 2、解决问题的基本思路 Monte Carlo方法的基本思想很早以前就被人们所发现和利用。早在17世纪,人们就知道用事件发生的"频率"来决定事件的"概率"。19世纪人们用投针试验的方法来决定圆周率π。本世纪40年代电子计算机的出现,特别是近年来高速电子计算机的出现,使得用数学方法在计算机上大量、快速地模拟这样的试验成为可能。 为了说明Monte Carlo方法的基本思想,让我们先来看一个简单的例子,从此例中你可以感受如何用Monte Carlo方法考虑问题。 例1:比如y=x^2(对x)从0积到1。结果就是下图红色部分的面积: 注意到函数在(1,1

用蒙特卡罗模拟球π的值

吃可爱长大的小学妹 提交于 2019-12-25 13:19:31
  蒙特卡罗 (Monte Carlo)方法,又称随机抽样或统计试验方法,属于计算 数学 的一个分支,它是在本世纪四十年代中期为了适应当时原子能事业的发展而发展起来的。传统的经验方法由于不能逼近真实的物理过程,很难得到满意的结果,而 蒙特卡罗 方法由于能够真实地模拟实际物理过程,故解决问题与实际非常符合,可以得到很圆满的结果。这也是我们采用该方法的原因。     基本原理及思想 编辑 当所要求解的问题是某种事件出现的概率,或者是某个随机变量的期望值时,它们可以通过某种“试验”的方法,得到这种事件出现的频率,或者这个随机变数的平均值,并用它们作为问题的解。这就是蒙特卡罗方法的基本思想。蒙特卡罗方法通过抓住事物运动的几何数量和几何特征,利用数学方法来加以模拟,即进行一种数字模拟实验。它是以一个概率模型为基础,按照这个模型所描绘的过程,通过模拟实验的结果,作为问题的近似解。可以把蒙特卡罗解题归结为三个主要步骤:构造或描述概率过程;实现从已知概率分布抽样;建立各种估计量。 蒙特卡罗解题三个主要步骤 编辑 构造或描述概率过程: 对于本身就具有随机性质的问题,如粒子输运问题,主要是正确描述和模拟这个概率过程,对于本来不是随机性质的确定性问题,比如计算定积分,就必须事先构造一个人为的概率过程,它的某些参量正好是所要求问题的解。即要将不具有随机性质的问题转化为随机性质的问题。

蒙特卡罗方法入门

此生再无相见时 提交于 2019-12-15 06:54:28
蒙特卡罗方法入门 通俗介绍:筐里有100个苹果, 我每次从筐中拿一个苹果A, 然后下一次再随机从筐中拿一个苹果B, 如果B比A大的话, 则舍弃A而保留B. 如此这般,很明显,如果我们拿了100次的话, 则最后在手中的就是最大的那个苹果. 如果不允许我们拿100次呢? 但是我们的策略是每次保留较好的. 则我们也有理由相信——经过N次(N<100)之后,留在我们手上的苹果也是接近最大的. 如果将每次拿苹果视作是采样的话, 则 蒙特卡洛算法就是每次采样尽量找好的,但不保证是最好的 , 而且采样越多,越近似最优解 原文 本文通过五个例子,介绍 蒙特卡罗方法 (Monte Carlo Method)。 一、概述 蒙特卡罗方法是一种计算方法。原理是通过大量随机样本,去了解一个系统,进而得到所要计算的值。 它非常强大和灵活,又相当简单易懂,很容易实现。对于许多问题来说,它往往是最简单的计算方法,有时甚至是唯一可行的方法。 它诞生于上个世纪40年代美国的"曼哈顿计划",名字来源于赌城蒙特卡罗,象征概率。 二、π的计算 第一个例子是,如何用蒙特卡罗方法计算圆周率π。 正方形内部有一个相切的圆,它们的面积之比是π/4。 现在,在这个正方形内部,随机产生10000个点(即10000个坐标对 (x, y)),计算它们与中心点的距离,从而判断是否落在圆的内部。 如果这些点均匀分布

系统学习机器学习之增强学习(四)--马尔可夫决策过程策略MC求解

匿名 (未验证) 提交于 2019-12-02 23:43:01
1.蒙特卡罗方法(Monte Carlo methods) 1. 蒙特卡罗方法的基本思想 蒙特卡罗方法又叫统计模拟方法,它使用随机数(或伪随机数)来解决计算的问题,是一类重要的数值计算方法。该方法的名字来源于世界著名的赌城蒙特卡罗,而蒙特卡罗方法正是以概率为基础的方法。 一个简单的例子可以解释蒙特卡罗方法,假设我们需要计算一个不规则图形的面积,那么图形的不规则程度和分析性计算(比如积分)的复杂程度是成正比的。而采用蒙特卡罗方法是怎么计算的呢?首先你把图形放到一个已知面积的方框内,然后假想你有一些豆子,把豆子均匀地朝这个方框内撒,散好后数这个图形之中有多少颗豆子,再根据图形内外豆子的比例来计算面积。当你的豆子越小,撒的越多的时候,结果就越精确。 2. 增强学习中的蒙特卡罗方法 现在我们开始讲解增强学习中的蒙特卡罗方法,与上篇的DP不同的是,这里不需要对环境的完整知识。蒙特卡罗方法仅仅需要经验就可以求解最优策略,这些经验可以在线获得或者根据某种模拟机制获得。 要注意的是,我们仅将蒙特卡罗方法定义在episode(状态序列) task上,所谓的episode task就是指不管采取哪种策略π,都会在有限时间内到达终止状态并获得回报的任务。比如玩棋类游戏,在有限步数以后总能达到输赢或者平局的结果并获得相应回报。 那么什么是经验呢?经验其实就是训练样本。比如在初始状态s,遵循策略π