数理统计

数理统计: 第一章

╄→гoц情女王★ 提交于 2019-12-22 07:22:25
基本概念 简单随机样本的两个特征: 代表性, 独立性 统计的任务: 根据从总体中抽取的 样本 , 去推断 总体的性质 样本中的每一个值都属于一个随机变量 样本中的随机变量的特性: 代表性( 与所考察的总体有相同的分布 ) 和 独立性 ( 每一个都是相互独立的随机变量 ) 样本的分布函数: 各个随机变量分布函数 的 连乘 分布率, 密度函数也是类似, (前提必须是: 独立 同分布) 两点分布的分布律: 统计量 和 样本矩 最终目的: 样本推断总体 需要对样本值进行一些 “加工” 需要构造一些样本的函数, 把样本中所包含的信息集中起来 统计量 : 样本函数中不包含任何关于总体X的未知参数, 称这个 样本函数 就是一个统计量 (所以统计量还应该是随机变量) 估计量 : 用于估计分布中参数的 统计量 常用的统计量 样本矩 样本均值, 样本方差, 修正样本方差(除以的是 n - 1), 样本标准差 样本的k阶原点矩, 样本的k阶中心矩 样本均值和修正样本方差期望 = 总体的均值和方差 无偏估计 经验分布函数 次序统计量, 次序统计量的分布 经验分布函数, 经验分布函数的性质 格里纹科定理 次序统计量 样本的观测值按照从小到大的排序进行排列 ( 统计量和观测值的下标要加上括号 ) 注意: 次序统计量中排在最前面的是 最小次序统计量 次序统计量中排在最后面的是 最大次序统计量

2019年第50周,35h,复习数理统计

孤街醉人 提交于 2019-12-15 23:56:24
记录自己的成长,为了督促自己,也为了帮助别人。 我将活出专注的人生,因为这是最好的选择。 科研学习的标杆:我将获得国奖,拿到美国大学的博士offer;每天的深度工作时间在12h 不是日程安排,是对完成工作以及深度工作时间的记录 努力成为优秀的人,成为可信度高的人,只有成为这样的人,才能通过写作、演讲等形式最大化自己的影响力 标题:周数,深度工作时间,当周的主要任务 每日的深度工作时间(科研学习) 周一,8h 上午:完成了90%的论文1.0版本,3.5h 下午:完成了10%的论文1.0版本;开始数理统计的复习,做了参数估计的一道习题,3h 晚上:继续数理统计的复习;规划了复习时间和作业2的2.0版本的时间安排,1.5h 周二,5h 上午:数理统计总结了2.1节的70%的知识点,2h 下午:老师讲了4道历年考题,2h 晚上:重做历年考题,1h 周三,6h 上午:整理数理统计课程上讲过的历年考题:求矩估计、最大似然估计和最小方差无偏估计,2.5h 下午:继续整理历年考题:求统计量的概率分布/密度,1.5h 晚上:历年考题:贝叶斯估计,2h 周四,6.5h 上午:理解原理和公式推导,正态总体的置信区间,正态总体和非正态总体的假设检验,1.5h 下午:做习题和记忆公式:复习贝叶斯估计的习题和公式,2.5h 晚上:做习题:历年考题的填空题,2.5h 周五,7h 上午:理解原理和记忆公式

数理统计(一)——用Python进行方差分析

廉价感情. 提交于 2019-12-10 23:08:43
数理统计(一)——Python进行方差分析   iwehdio的博客园: https://www.cnblogs.com/iwehdio/   方差分析可以用来推断一个或多个因素在其状态变化时,其因素水平或交互作用是否会对实验指标产生显著影响。主要分为单因素方差分析、多因素无重复方差分析和多因素重复方差分析。   做数理统计课后题,发现方差分析计算比较麻烦,想用Python掉包实现。但是发现大多教程对参数的讲解不是很清楚,在此做记录。   主要用到的库是pandas和statsmodels。简要流程是,先用pandas库的DataFrame数据结构来构造输入数据格式。然后用statsmodels库中的ols函数得到最小二乘线性回归模型。最后用statsmodels库中的anova_lm函数进行方差分析。      首先,是输入的数据格式。使用pandas的DataFrame,每一行为一次试验的因素水平和试验结果。以下图中的题目为例。   则对于因素A和因素B即结果R可表示为如下的DataFrame: data = pd.DataFrame([[1, 1, 32], [1, 2, 35], [1, 3, 35.5], [1, 4, 38.5], [2, 1, 33.5], [2, 2, 36.5], [2, 3, 38], [2, 4, 39.5], [3, 1, 36], [3,

1-基本概念(概率论与数理统计学习笔记)

旧街凉风 提交于 2019-12-03 17:34:31
目录 1. 基本概念 名词解释 随机试验: 随机事件: 基本事件: 复合事件: 样本空间: 样本点: 符号解释 1. 基本概念 名词解释 随机试验: [x] 在相同条件下可重复,即可重复试验 [x] 试验的结果不可预测 [x] 试验的结果不止一个 随机事件: [x] 随机事件是在随机试验中,可能出现也可能不出现,而在大量重复试验中具有某种规律性的事件叫做随机事件(简称事件) 基本事件: [x] 在概率论中,基本事件(也称为原子事件或简单事件)是一个仅在样本空间中单个结果的事件 复合事件: [x] 多个事件的集合,为复合事件. 样本空间: [x] 所有基本事件的集合称为样本空间,又叫全集,必然事件. 样本点: [x] 样本空间中的基本元素 符号解释 \(\emptyset\) : 空集 \(\Omega\) : 全集 来源: https://www.cnblogs.com/GGTomato/p/11805153.html

数理统计要点

*爱你&永不变心* 提交于 2019-12-03 07:48:03
虽然我也粗读过统计学的几本书,但从易懂性来说,都没有学校老师给的ppt好,或者说自己看书比较困难,但是听老师讲课就很容易懂。所以,我建议有条件的同学能够选修统计学这门课,没条件的同学可以去网上找一些相关视频,配套书籍可以选择茆诗松的《概率论与数理统计》。另外,《Head First Statistics》一书可以用来预热。 学了统计学,你至少应该知道: 基本的抽样方法 数据分布的描述统计量有哪些?一组样本数据分布的数值特诊可以从三个方面进行描述: 描述水平的统计量: 数据的水平:也称为集中趋势或位置度量,反应全部数据的数值大小。 均值、中位数、分位数、众数 描述差异的统计量 数据的差异:反应数据间的离散程度。 极差和四分位差、方差和标准差、变异系数、标准分数 描述分布形状的统计量 分布的形状:反应数据分布的偏度和峰度。 偏度系数、峰度系数 你需要了解一些重要的分布,比如正态分布、chi-square分布、t分布、F分布等。 假设检验是用来做什么的、置信区间的概念、MSE (Mean Squared Error)均方误差、RMSE(Root Mean Squard Error)均方根误差、MAE(平均绝对误差)、R-squared(拟合优度)的含义等等。 怎样进行数据预处理 怎样整理和显示数据 你需要了解各种图的作用和适用场景,常用图包括条形图、饼图、直方图、折线图、箱线图、散点图

数理统计二(概率论)

匿名 (未验证) 提交于 2019-12-03 00:27:02
一,条件概率 1. 概念 事件A已发生的条件下事件B发生的概率。(记为P(B|A)) 2. 定义 设A、B是两个事件,且P(A)>0,称 P ( B / A ) = P ( A B ) P ( A ) P ( B / A ) = P ( A B ) P ( A ) 为事件A发生的条件下事件B发生的条件概率。 二,乘法定理 1、定义:设P(A)>0,则有 P(AB)=P(B|A)P(A) 称 为乘法公式。 2、推广: P(ABC)=P(C|AB)P(B|A)P(A) 三,全概率公式和贝叶斯公式 1、样本空间的划分 (1)定义:设S为试验E的样本空间,B1,B2,…,Bn为E的一组事件。若 (Ⅰ) BiBj=ф,i≠j,i,j=1,2,…,n; (Ⅱ)B1∪B2 ∪ … ∪ Bn=S 则称B1,B2,…,Bn为样本空间S的一个划分。 (2)举例:设试验E为“掷一颗骰子观察点数”,它的样本空间为 S={1,2,3,4,5,6}。 E的一组事件B1={1,2,3}, B2={4,5}, B3={6}是S的一个划分。 2、全概率公式 (1)定义:设试验E的样本空间S,A为E的事件, B 1 , B 2 , … , B n B 1 , B 2 , … , B n 为S的一个划分,且 P ( B i ) > 0 ( i = 1 , 2 , … , n ) , P ( B i ) > 0 ( i

概率论与数理统计学习笔记——第十六讲——二元随机变量,离散型随机变量分布律

ε祈祈猫儿з 提交于 2019-12-02 09:09:57
1. 引例 2. 二元随机变量 3. 二元离散型随机变量 4. 离散型随机变量的联合概率分布律 5. 离散型随机变量的联合概率分布律的性质 6. 离散型随机变量的联合概率分布律示例 来源: https://blog.csdn.net/hpdlzu80100/article/details/102748685

概率论与数理统计图式(第三章 多维随机变量)

瘦欲@ 提交于 2019-12-01 04:24:46
概率论与数理统计图式(第三章 多维随机变量) 1、二位随机变量及其分布 1)二维随机变量定义 设随机试验E 的样本空间为Ω,对于每一样本点ω∈Ω ,有两个实数 X (Ω), Y (Ω) 与之对应,称它们构成的有序数组 ( X , Y ) 为 二维随机变量。 注:对二维随机变量( X, Y )来说, X,Y 都是定义在Ω上的一维随机变量. 2)联合分布函数 (1)联合分布函数几何意义 平面随机点( X, Y ) 落入以(x, y)为顶点的左下方区域的概率。 (2)联合分布函数的性质 单调不减性 非负有界性 右连续性 相容性    3)边缘分布函数 (1)定义:称X、Y各自 的分布函数 FX(x) 与 FY(y) 为( X, Y ) 的边缘分布函数。 (2)由联合分布函数可确定边缘分布函数: 2、联合分布律 用边缘分布律不一定能确定联合分布律! 原因:多维随机变量的联合分布不仅与每个变量的边缘分布有关,而且还与每个变量之间的联系有关!两个随机变量X,Y不等同于二维随机变量(X,Y)! 3、联合概率密度 (1)联合概率密度的物理解释:概率在(x, y)处的面密度. (2)联合概率密度曲面 (3)f(x)满足 对边缘概率密度的求解,实质上是求带参变量的积分。 难点: 积分上下限的确定! 可通过图形来帮助解决这个问题。 来源: https://www.cnblogs.com

概率论与数理统计

百般思念 提交于 2019-11-28 12:57:28
原文引用 https://www.dazhuanlan.com/2019/08/25/5d6226dd86e0b/ 第一章 概率论的基本概念 随机试验 的全部可能结果组成的集合S称为 样本空间 。样本空间S的子集称为 事件 。当且仅当这一子集中的一个样本点出现时,称这一事件发生。事件是一个集合,因而事件间的关系与事件的运算自然按照集合论中集合之间的关系和集合的运算来处理。 在一次试验中,一个事件(除必然事件与不可能事件外)可能发生也可能不发生,其发生的可能性的大小是客观存在的。事件发生的频率以及它的稳定性,表明能用一个数来表征事件在一次试验中发生的可能性大小。我们从频率的稳定性及频率的性质得到启发和抽象,给出了概率的定义。 我们定义了一个集合(事件)的函数P(.),它满足三条基本性质: 非负性 规范性 可列可加性 这一函数的函数值P(A)就定义为事件A的 概率 。 概率的定义只给出概率必须满足的三条基本性质,并未对事件A的概率P(A)给定一个具体的数。只在古典概型的情况,对于每个事件A给出了概率P(A)=k/n的,一般,我们可以进行大量的重复试验,得到事件A的频率,而以频率作为P(A)的近似值。或者根据概率的性质分析,得到P(A)的取值。 在古典概型中我们证明了条件概率的公式: $$ P(B|A) = frac{P(AB)}{P(A)} , P(A) > 0. $$

概率论与数理统计总结

耗尽温柔 提交于 2019-11-27 18:53:15
前置知识: \(1.\) 高中数学相关知识。 \(2.\) 高等数学(微分,定积分,不定积分,泰勒展开,极限等) 定积分常用计算方式:牛顿—莱布尼兹公式:( \(F()\) 为 \(f()\) 的原函数,即 \(F^{'}()=f()\) ) \[ \int_a^b{f(x)dx}=F(b)-F(a) \] 泰勒中值定理 \(1\) : \(f(x)=f(x_0)+f'(x_0)(x-x_0)+\frac{f''(x_0)}{2!}(x-x_0)^2+...+\frac{f^{(n)}(x_0)}{n!}(x-x_0)^n+R_n(x)\) ,满足 \(f(x)\) 在 \(x_0\) 处有 \(n\) 阶导数, \(x\) 为 \(x_0\) 的一个邻域中的任意值, \(R_n(x)=o((x-x_0))^n\) 称为佩亚诺余项。 泰勒中值定理 \(2\) : \(f(x)=f(x_0)+f'(x_0)(x-x_0)+\frac{f''(x_0)}{2!}(x-x_0)^2+...+\frac{f^{(n)}(x_0)}{n!}(x-x_0)^n+R_n(x)\) ,满足 \(f(x)\) 在 \(x_0\) 的某一邻域中有 \(n+1\) 阶导数, \(x\) 为 \(x_0\) 该邻域中的任意值, \(R_n(x)=\frac{f^{n+1}(\xi)}{(n+1)!}(x