核密度估计

十三、核密度估计

£可爱£侵袭症+ 提交于 2020-03-21 22:28:15
参考url: https://jakevdp.github.io/PythonDataScienceHandbook/05.13-kernel-density-estimation.html 密度评估器是一种利用D维数据集生成D维概率分布估计的算法,GMM算法用不同高斯分布的加权汇总来表示概率分布估计。核密度估计(kernel density estimation,KDE)算法将高斯混合理念扩展到了逻辑极限(logical extreme),它通过对每个点生成高斯分布的混合成分,获得本质上是无参数的密度评估器。 1、KDE的由来:直方图   密度估计评估器是一种寻找数据集生成概率分布模型的算法。   一维数据的密度估计——直方图,是一个简单的密度评估器,直方图将数据分成若干区间,统计落入每个区间内的点的数量,然后用直观的方式将结果可视化。                   2、核密度估计的实际应用   核密度估计的自由参数是核类型(kernel)参数,他可以指定每个点核密度分布的形状。   核带宽(kernel bandwidth)参数控制每个点的核的大小   核密度估计算法在sklearn.neighbors.KernelDensity评估器中实现,借助六个核中的任意一个核、二三十个距离量度就可以处理具有多个维度的KDE。   由于KDE计算量非常大,因此Scikit

非参数估计-高斯核平滑Gaussian kernel smoothing-非参数密度估计

↘锁芯ラ 提交于 2020-03-11 03:39:22
目录 1 非参数回归-核平滑 1.1 概念和计算 1.2 Nadaraya-Watson回归 1.3 高斯核 2 高斯核平滑过程-Python实现 2.1 加载库和生成数据 2.2 Full Width at Half Maximum (FWHM) 2.3 分步进行平滑 2.4 二维平滑 2.5 为什么要进行平滑 3 非参数密度估计(Non-parametric density estimation) 3.1 直方图 3.2 非参数密度估计的通常形式 3.3 Parzen windows 3.4 Smooth kernels 3.4.1 概念-为什么选择? 3.4.2 如何选择Bandwidth 4 总结 1 非参数回归-核平滑 1.1 概念和计算 非参数化回归 是指并不需要知道总的分布的情况下进行的一种统计推断回归方法。 核平滑 是一种用来估计实值方程的统计方法,其实也就是一种非参数回归。核平滑来作为周围观察数据的 加权平均值 。权重由核确定,比如越近的数据权重越大。估计方程式平滑的,平滑程度由一个参数控制。 当预测变量的 维度小 时(p < 3),这个技术是最有效的,比如对于数据可视化。 计算过程如下: 参数意义如下: 令Y(X) 是一个关于X的连续函数。对于每一个X0,Nadaraya-Watson 加权平均值为 (smooth Y(X) estimation) 1.2