核密度估计ppt课件.pptx
核密度估计,密度估计算法大体分为三类:参数方法,半参数方法和非参数方法。核密度估计是在概率论中用来估计未知的密度函数,属于非参数检验方法之一,由Rosenblatt(1955)和Emanuel Parzen(1962)提出,又名Parzen窗(Parzen window)。,核密度估计简介,由于在众多的实际问题当中,我们对于未知概率密度函数的信息一无所知,所以,有参估计方法以及半参估计方法不适用于这些问题的求解。因此核密度估计算法是当前最有效和应用最广泛的一种非参数密度估计算法。在使用核方法进行概率密度函数估计时,关键的问题在于核函数以及窗口宽度的确定。,核密度估计简介,设 X1,X2,Xn为单元变量 X 的独立同分布的一个样本,则 X 所服从分布的密度函数 f(X)的核密度估计为:f(X)=1=1 1()其中,K(u)为核函数,h为窗口宽度。,一维核密度估计,在一维核密度的基础上,可推出二维核密度估计计算公式。数据data=(x,y),令h=(,)为一个窗宽向量。则核密度函数为:=1=1,=1,二维核密度估计,选取的核密度必须满足三条性质:(1)非负性:K(x)0,x R;(2)对称性:K(x)=K(x),x R;(3)归一性:即 K(x)在区间,+上的积分为 1,+=1。在该程序中选取的核密度函数为高斯核函数:=1 2 2 2,核密度函数的选取,均方积分误差是衡量估计所得的概率密度函数 与真实概率密度函数f(x)之间的差异,英文表示为Mean Integrated Square Error,简称MISE。表达式为:=()2 选择的窗宽为MISE取值最小的情况=,高斯核函数最佳窗宽的选择,采用渐进近似:AMISE(H)=1(4)2|1 2+1 4()4(vech H)即最佳窗宽选择为:=argmin(),=()由此可以在x方向和y方向上分别计算出窗宽:,。,高斯核函数窗宽的选择,