概率统计

概率统计笔记1

孤街醉人 提交于 2020-02-17 02:25:04
二项分布 n次独立随机试验,成功概率p,定义变量X,表示成功的次数k( κ ∈ [ 0 , n ] ),则分布P(X=k): p ( k ) = ( n k ) p k p n − k 特别的例子就是,抛硬币.做100次抛硬币试h验(抛10次硬币)你会发现这一百次的试验,所记录的k次成功,k有高,有低,(0,10)之间.直觉告诉我,这个k的分布接近正态分布. 当日常说,人的智商接近正态分布.随机变量是由什么的随机事件映射成? - 这里的数学thoughts 1. Events Algebra.Set Theory. complex events → simplified events.something like ,多项式化简. 2. Probability measure not just about ∑ , 0 ≤ P ( A ) ≤ 1 ,它们只是表示的符号.内容,比如0,1之间,事件的和的概率是事件概率的和;才是概率测度的属性.这个公理和欧几里得公理一样,也是历史的归纳得出.和我们计算组合数一样也是归纳出来的. 3. Reflection 随机变量random variable X ( u ) : u → R 其中 U ( u ) ⊂ Ω . - distribution function: F ( x ) = P ( X < x ) , − ∞ < x < + ∞

概率统计丨陈希孺《概率论与数理统计》思维导图

走远了吗. 提交于 2020-02-04 00:49:49
除了线性代数,概率论(Probability theory)和统计学(Statistics)也是机器学习中常用的数学工具。陈希孺老先生的《概率论与数理统计》在知乎上的评价很高,我在上学期花时间读了一遍,读完的感觉是,本书的概率论部分可读性较强,举了很多例子帮助理解,通俗易懂,阐明了很多原理和联系,如二项分布、泊松分布、超几何分布、几何分布之间的关系。但数理统计部分,更加严谨的概念定义和公理化相对晦涩,让我不易理解。当然,主要原因还是我水平太低。我觉得本书的数理统计部分可以结合其他材料学习。 此外再推荐一下其他的学习资源。 公开课 可汗学院公开课:统计学 书 《概率导论》 《概率论与数理统计》 《深入浅出统计学》 讲义 CS229概率论讲义 来源: https://www.cnblogs.com/vincent1997/p/12258176.html

概率统计——期望、方差与最小二乘法

旧时模样 提交于 2020-01-24 18:59:01
本文始发于个人公众号: TechFlow 今天这篇文章和大家聊聊 期望和方差 。 期望 期望这个概念我们很早就在课本里接触了,维基百科的定义是: 它表示的是一个随机变量的值在每次实验当中可能出现的结果乘上结果概率的总和 。换句话说,期望值衡量的是多次实验下,所有可能得到的状态的平均结果。 我们举两个简单的例子,第一个例子是掷骰子。 我们都知道一个骰子有6个面,分别是1,2,3,4,5,6。我们每次投掷得到其中每一个面朝上的概率都是一样的,是1/6。对于投骰子这个事件而言,它的期望应该是: E ( X ) = 1 ∗ 1 6 + 2 ∗ 1 6 + ⋯ + 6 ∗ 1 6 = 3.5 E(X) = 1 * \frac{1}{6} + 2 * \frac{1}{6} + \cdots + 6 * \frac{1}{6} = 3.5 E ( X ) = 1 ∗ 6 1 ​ + 2 ∗ 6 1 ​ + ⋯ + 6 ∗ 6 1 ​ = 3 . 5 也就是说,我们如果投掷大量的骰子,得到的平均结果应该是3.5,但是骰子上并没有这个点数可以被掷出来。 另一个经典的例子就是 博弈游戏 ,老赌徒们水平各有高低,但一定深谙期望这个概念。举个最简单的例子,比如美国轮盘当中一个有38个数字,每次可以押一个数字。如果押中了,赌徒可以获得35倍的奖金,如果押不中,钱打水漂。我们来算下期望: E ( X ) =

概率统计——期望、方差与最小二乘法

一个人想着一个人 提交于 2020-01-24 17:22:34
本文始发于个人公众号: TechFlow 今天这篇文章和大家聊聊 期望和方差 。 期望 期望这个概念我们很早就在课本里接触了,维基百科的定义是: 它表示的是一个随机变量的值在每次实验当中可能出现的结果乘上结果概率的总和 。换句话说,期望值衡量的是多次实验下,所有可能得到的状态的平均结果。 我们举两个简单的例子,第一个例子是掷骰子。 我们都知道一个骰子有6个面,分别是1,2,3,4,5,6。我们每次投掷得到其中每一个面朝上的概率都是一样的,是1/6。对于投骰子这个事件而言,它的期望应该是: \[E(X) = 1 * \frac{1}{6} + 2 * \frac{1}{6} + \cdots + 6 * \frac{1}{6} = 3.5\] 也就是说,我们如果投掷大量的骰子,得到的平均结果应该是3.5,但是骰子上并没有这个点数可以被掷出来。 另一个经典的例子就是 博弈游戏 ,老赌徒们水平各有高低,但一定深谙期望这个概念。举个最简单的例子,比如美国轮盘当中一个有38个数字,每次可以押一个数字。如果押中了,赌徒可以获得35倍的奖金,如果押不中,钱打水漂。我们来算下期望: \[E(X) = -1 * \frac{37}{38} + 35 * \frac{1}{38}= -\frac{3}{38}\] 我们可以发现这个期望是一个 负值 ,也就是说短期内可能是盈利的,如果我们多次游戏

概率统计15——泊松分布

↘锁芯ラ 提交于 2020-01-20 22:04:07
  很多场合下,我们感兴趣的试验进行了很多次,但其中成功的却发生的相当稀少。例如一个芯片的生厂商想要把生产出的芯片做一番检测后再出售。每个芯片都有一个不能正常工作的微小概率p,在数量为n的一大批芯片中,出现r个故障芯片的概率是多少? 相关阅读 单变量微积分30——幂级数和泰勒级数 概率统计13——二项分布与多项分布 二项式的泊松近似   问题似乎很简单,芯片故障的概率符合二项分布X~B(n,p),我们可以用二项分布计算出现r个故障芯片的概率:   实际问题是,芯片的数量很大,但故障率又是一个很小的数值,虽然二项分布提供了一个精确的概率模型,但计算起来并不容易,而且在计算时还会丢掉大量的精度。既然这样,还不如一开始就使用一个近似式计算预期的概率。   我们首先看看全部芯片都合格(每次试验都不成功)的概率:   等号两边同时取对数:   接下来需要利用一点无穷级数和积分的知识:   同时我们也知道∫dx/1-x的精确表达:   由此可以得到:   当p远远小于1,且np2远远小于1时,可以忽略p的高阶项,得到近似式:   n个芯片全部合格的概率约等于e-np,出现r个故障芯片的概率又是多少呢?直接计算并不容易,幸运的是,我们可以用二项分布精确表达r个和r-1个故障芯片的概率的比值:   当n很大时,对于少量r个故障芯片来说,n-(r-1) ≈ n;对于很小概率p来说,p/(1-p) ≈

概率统计15——泊松分布

若如初见. 提交于 2020-01-20 20:55:20
  很多场合下,我们感兴趣的试验进行了很多次,但其中成功的却发生的相当稀少。例如一个芯片的生厂商想要把生产出的芯片做一番检测后再出售。每个芯片都有一个不能正常工作的微小概率p,在数量为n的一大批芯片中,出现r个故障芯片的概率是多少? 相关阅读 单变量微积分30——幂级数和泰勒级数 概率统计13——二项分布与多项分布 二项式的泊松近似   问题似乎很简单,芯片故障的概率符合二项分布X~B(n,p),我们可以用二项分布计算出现r个故障芯片的概率:   实际问题是,芯片的数量很大,但故障率又是一个很小的数值,虽然二项分布提供了一个精确的概率模型,但计算起来并不容易,而且在计算时还会丢掉大量的精度。既然这样,还不如一开始就使用一个近似式计算预期的概率。   我们首先看看全部芯片都合格(每次试验都不成功)的概率:   等号两边同时取对数:   接下来需要利用一点无穷级数和积分的知识:   同时我们也知道∫dx/1-x的精确表达:   由此可以得到:   当p远远小于1,且np 2 远远小于1时,可以忽略p的高阶项,得到近似式:   n个芯片全部合格的概率约等于e -np ,出现r个故障芯片的概率又是多少呢?直接计算并不容易,幸运的是,我们可以用二项分布精确表达r个和r-1个故障芯片的概率的比值:   当n很大时,对于少量r个故障芯片来说,n-(r-1) ≈ n;对于很小概率p来说,p/(1

概率统计——讲透最经典的三种概率分布

痴心易碎 提交于 2020-01-17 08:54:27
本文始发于个人公众号: TechFlow 这一讲当中我们来探讨三种经典的概率分布,分别是伯努利分布、二项分布以及多项分布。 在我们正式开始之前,我们先来明确一个概念,我们这里说的分布究竟是什么? 无论是在理论还是实际的实验当中,一个事件都有可能有若干个结果。每一个结果可能出现也可能不出现,对于每个事件而言出现的可能性就是概率。而分布,就是衡量一个概率有多大。 伯努利分布 明确了分布的概念之后,我们先从最简单的伯努利分布开始。 伯努利分布非常简单,就是假设一个事件只有发生或者不发生两种可能,并且这两种可能是固定不变的。那么,显然,如果假设它发生的概率是p,那么它不发生的概率就是1-p。这就是伯努利分布。 生活中所有只可能出现两种结果并且概率保持不变的事件都可以认为服从伯努利分布,比如抛硬币,比如生孩子是男孩还是女孩。 伯努利实验就是做一次服从伯努利概率分布的事件,它发生的可能性是p,不发生的可能性是1-p。 二项分布 我们明确了伯努利分布之后再来看二项分布就简单了。说白了二项分布其实就是多次伯努利分布实验的概率分布。 以抛硬币举例,在抛硬币事件当中,每一次抛硬币的结果是独立的,并且每次抛硬币正面朝上的概率是恒定的,所以单次抛硬币符合伯努利分布。我们假设硬币正面朝上的概率是p,忽略中间朝上的情况,那么反面朝上的概率是q=(1-p)。我们重复抛n次硬币,其中有k项正面朝上的事件

概率统计——为什么条件概率的结果总和直觉不同?

馋奶兔 提交于 2020-01-10 08:26:22
从前有一户夫妻,他们生了两个孩子。已知其中一个是女孩,那么另一个孩子也是女孩的概率是多少呢? 这是一道概率论课本上的 经典问题 ,一开始的时候,很多人会觉得两个孩子的性别是独立事件,我们知道其中一个孩子的性别,应该对另一个孩子没有影响。但实际上并不是这样,我们可以列出两个孩子性别的所有可能: 从上面这个表格里,我们可以看出来,两个孩子的性别组合一共有4种。其中至少有一个女孩的是三种,而这三种当中,两个孩子都是女孩的有一种。所以答案就是1/3。 除了表格列举出所有情况之外,我们还可以通过 条件概率 来计算。 我们直接套用条件概率的公式:假设A事件代表两个孩子中有一个是女孩,B事件是两个孩子都为女孩。显然,我们要求的就是P(B|A)。 根据公式: 在这题当中A事件发生,B一定发生,所以P(AB) = P(A). 我们知道,两个孩子的性别是独立事件,其中有一个为女孩的概率等于1减去两个都是男孩的概率,两个都是男孩的概率等于 所以至少有一个女孩的概率等于3/4。同理,两个都为女孩的概率是1/4。 所以,我们套入公式 所以另一个孩子也是女孩的概率是 1/3 。 这个答案的计算过程没什么问题,我想大家应该都能看明白,但是不知道会有多少人觉得奇怪。为什么答案不是 1/2 呢?难道两个孩子的性别 不是独立 的吗?一个孩子是女孩和另一个孩子是男是女应该没有联系呀? 在我们回答这个问题之前

概率统计基本概念总结

会有一股神秘感。 提交于 2020-01-05 22:08:59
一、概率论基本概念 样本空间、随机事件 频率和概率 概率的相关运算和性质 等可能概型:古典概型 条件概率 全概率公式:你用条件概念算事件概率 贝叶斯公式:条件概率用于反推计算条件概率 事件的相互独立性 二、随机变量极其分布 随机变量:每个样本点映射一个数字来表征 基本离散型随便基变量分布:0-1分布、伯努利实验二项分布、泊松分布 分布函数:随机变量概率在小于某随机变量的区间的概率和 概率密度函数:连续性的随即变量的概率密度分布函数,分布函数是密度函数的定积分。 概率密度的几种分布:均匀分布、指数分布、正态分布、 随机变量之间的映射函数,及对映射前后概率密度函数的推导 三、多维随机变量极其分布 随机变量由二维向量表征,称为:二维随机变量 二维随机变量的分布函数称为联合分布函数 联合分布函数式联合分布密度的定重积分 二维随机中某一维变量的分布函数称为二维联合分布函数的边缘分布 相对于边缘分布函数还有边缘概率密度 边缘分布主要用于用联合分布求边缘分布 二维变量概率和其中一维的的条件分布律 某一维条件确定下的条件概率密度分布 联合分布的随机变量相互独立 二维随机变量联合分布的几种: 1、z=x+y分布:卷积公式 2、z=x/y、z=xy的分布 3、M=max{x,y}及N={x,y}的分布 四、随机变量的数字特征 离散随机变量*概率的的全分布求和值收敛,则称这个值为数学期望。又称均值 方差

MATLAB概率统计函数(4)

白昼怎懂夜的黑 提交于 2019-12-24 12:06:00
4.8 假设检验 4.8.1 已知,单个正态总体的均值μ的假设检验(U检验法) 函数 ztest 格式 h = ztest(x,m,sigma) % x为正态总体的样本,m为均值μ0,sigma为标准差,显著性水平为0.05(默认值) h = ztest(x,m,sigma,alpha) % 显著性水平为 alpha [h,sig,ci,zval] = ztest(x,m,sigma,alpha,tail) %sig为观察值的概率,当sig为小概率时则对原假设提出质疑,ci为真正均值μ的 1- alpha置信区间,zval为统计量的值。 说明 若h=0 ,表示在显著性水平 alpha下,不能拒绝原假设; 若h=1 ,表示在显著性水平 alpha下,可以拒绝原假设。 原假设:, 若tail=0 , 表示备择假设:(默认,双边检验); tail=1,表示备择假设:(单边检验); tail=-1 ,表示备择假设: (单边检验)。 例 4-74 某车间用一台包装机包装葡萄糖,包得的袋装糖重是一个随机变量,它服从正态分布。当机器正常时,其均值为0.5公斤,标准差为0.015。某日开工后检验包装机是否正常,随机地抽取所包装的糖 9 袋,称得净重为(公斤) 0.497, 0.506, 0.518, 0.524, 0.498, 0.511, 0.52, 0.515, 0.512 问机器是否正常?