核密度估计 Kernel Density Estimation (KDE) MATLAB

Posted olivermahout

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了核密度估计 Kernel Density Estimation (KDE) MATLAB相关的知识,希望对你有一定的参考价值。

 

对于已经得到的样本集,核密度估计是一种可以求得样本的分布的概率密度函数的方法:

 

通过选取核函数和合适的带宽,可以得到样本的distribution probability,在这里核函数选取标准正态分布函数,bandwidth通过AMISE规则选取

具体原理及定义:传送门 https://en.wikipedia.org/wiki/Density_estimation

MATLAB 代码实现如下:

 

 1 % Kernel Density Estimation
 2 % 只能处理正半轴密度
 3 function [t, y_true, tt, y_KDE] = KernelDensityEstimation(x)
 4 % clear
 5 
 6 % x = px_last;
 7 % x = px_last_tu;
 8 %%
 9 %参数初始化
10 Max = round(max(x));           %数据中最大值
11 Min = round(min(x));           %数据中最小值
12 Ntotal = length(x);     %数据个数
13 tt = 0 : 0.1 : Max;     %精确x轴
14 t = 0 : Max;            %粗略x轴
15 
16 y_KDE = zeros(10 * Max+1, 1);   %核密度估计值
17 sum1 = 0;                       %求和的中间变量
18 %%
19 %计算带宽h
20 R = 1/(2*sqrt(pi));
21 m2 = 1;
22 h = 3;
23 % h = (R)^(1/5) / (m2^(2/5) * R^(1/5) * Ntotal^(1/5));
24 
25 %%
26 %计算核密度估计
27 for i = 0 : 0.1 : Max        
28     for j = 1 : Ntotal
29         sum1 = sum1 + normpdf(i-x(j));
30     end
31     y_KDE(round(i*10+1)) = sum1 / (h * Ntotal);
32     sum1 = 0;
33 end
34 
35 sum2 = sum(y_KDE)*0.1;  %归一化KDE密度
36 for i = 0 : 0.1 : Max
37     y_KDE(round(i*10+1)) = y_KDE(round(i*10+1))/sum2;
38 end
39 
40 %%
41 %计算真实密度的分布
42 y_true = zeros(Max+1,1);   
43 for i = 0 : Max
44     for j = 1 : Ntotal
45         if (x(j) < i+1)&&(x(j) >= i)
46             y_true(i+1) = y_true(i+1) + 1;
47         end
48     end
49     y_true(i+1) = y_true(i+1) / Ntotal;
50 end
51 
52 %%
53 %绘图
54 
55 % figure(1)           %真实密度的分布图象
56 % bar(t, y_true);
57 % axis([Min Max+1 0 max(y_true)*1.1]);
58 % 
59 % figure(2)           %核密度估计的密度分布图象
60 % plot(tt, y_KDE);
61 % axis([Min Max 0 max(y_true)*1.1]);

 

给定测试数据:

data = [1,2,3,4,5,2,1,2,4,2,1,4,7,4,1,2,4,9,8,7,10,1,2,3,1,0,0,3,6,7,8,9,4]

样本的条形统计图和KDE密度分布图分别如下,可以看到KDE可以较好的还原样本的分布情况:

 

技术分享图片

真实概率分布图

技术分享图片

KDE密度分布图

 

以上是关于核密度估计 Kernel Density Estimation (KDE) MATLAB的主要内容,如果未能解决你的问题,请参考以下文章

R008 基本图形-核密度图plot(density())

图像的核密度估计

R语言绘制核密度图实战(Kernel Density Plot)

Kernel Density Estimation - 将图例比例更改为每平方米的密度

R语言plotly可视化:plotly可视化多个数据集归一化直方图(historgram)并在直方图中添加密度曲线kde(核密度估计的密度曲线density plot)

核密度估计的峰值