似然,似然,似是而然!
1.1 似然是蛤?
在统计学中,似然和概率可是两码事。
概率:在已知的模型下,某事件发生的可能性。
似然:在未知的模型下,发生了一系列的事件,有这些事件的结果去估计该未知模型的相关参数(条件)。
举一个小例子可能会更形象。现在我有一枚标准的硬币,我将它抛在了空中,这时我想知道它落地时是正面朝上的可能性是多少?毫无疑问,因为该硬币是标准的,正面和反面朝上的概率是~~ 五五开~~(卢老爷警告)50%。而似然就是,现在我拿到的硬币可能不在是标准的,有可能正面比反面重也有可能是相反的情况,我将这个硬币抛了一千次,发现有700次是正面朝上,300次是反面朝上。那么我可以估计这枚硬币不是标准的硬币,这枚非标准的硬币的随意一抛正面朝上的概率(参数)估计为0.7(标准硬币
的参数为0.5)。
总的来说:概率就是在已知模型下,对可能发生的救国进行描述。似然就是通过已经得到的结果发生该结果的模型进行描述。
1.2 似然函数又是蛤?
概率密度函数:
似然函数:
在x和相互对应时,两个函数的数值是相等。但两个函数所表示的含义是完全不同的。似然函数是给定参数的情况下,发生已知结果x的可能性。
同样还是硬币为例子进行说明。加入我抛了五次的硬币,产生了一个确切的结果即正正反正反,现在我们根据这个硬币的性质假设抛出为正的概率为(即设置了该硬币的相关参数值为),那么 出现这一结果(正正反正反)的可能性就是(1-)(1-) ,这个可能性的值就是似然函数的值。
1.3似然函数到最大似然估计
还是延续上文的硬币的例子。理论上来讲我想知道一枚未知硬币的参数,我得抛无数次,但是我时间有限,我只抛了五次就想估计一下这枚硬币的参数。根据我们得到的似然函数值即,随着的取值不同,其函数值也不同。当=0.2时,似然函数值为0.00512,当=0.3时,其函数值为0.01323。显然后者的似然函数值大于前者,故如果硬币的参数是0.3与参数是0.2相比,更有可能获得我们已知的五次实验结果,故估计参数为0.3更靠谱。
显然存在一个=0.6使得函数值取最大值,即当估计此硬币的参数为=0.6(正面朝上)时,出现正正反正反这种情形的可能性最大。所以根据这五次的实验,我们对此硬币的参数能做出的最好的估计就是0.6。当然五次实验的数据得出的估计是难以说服人的,所以当做了五万次实验得出的估计是更接近真实的参数的。
最大似然估计就是利用你手头得到的结果数据,从而对总体的参数做一个最靠谱的估计。
1.4 最大似然估计的一般套路:
根据概率分布、统计的结果写出似然函数。对似然函数取对数(连乘变连加)。求导,一阶导数为0。解方程。做结论。
来源:CSDN
作者:奋发秃强
链接:https://blog.csdn.net/weixin_43770577/article/details/104064438