第四讲 非参数统计 中文版课件.ppt
《第四讲 非参数统计 中文版课件.ppt》由会员分享,可在线阅读,更多相关《第四讲 非参数统计 中文版课件.ppt(48页珍藏版)》请在三一办公上搜索。
1、非参数统计,Kruskal-Wallis单因素方差分析,独立样本Mann-Whitney检验,配对样本 Wilcoxon 符号秩检验,配对样本符号检检验,目录,Friedman秩方差分析,随机游程检验,通用两样本转移模模型,秩相关及其检检验,绪论,参数统计方法,定义:样本被视为从分布族的某个参数族抽取出来的总体的代表,而未知的仅仅是总体分布具体的参数值,推断问题就转化为对分布族的若干个未知参数的估计问题,用样本对这些参数做出估计或者进行某种形式的假设检验,这类推断方法称为参数方法。一个典型的参数检验过程:1. 总体参数(如总体均值)2. 假定数据的形态为数值型(定比数据)3. 有很强的假定(一
2、般要求分布正态)4. 例子: Z Test, t Test, 2 Test,15.1 绪论,2.过多无法证明的假设,1.有些试验的观测值无法量化,参数估计的局限,15.1 绪论,1,老师上课的质量水平,3,2,对食物的喜爱程度,1.无法量化的观测值,我们之前遇到的问题中观测值都是可以量化的,比如考试的分数,两组人的身高等等,但还有一些观测值是无法量化的,我们可以去比较好坏,高低却无法用数字来度量,15.1 绪论,在10.8中提到,用t检验比较两个基于独立样本的均值是否相等时,有隐含的假设是两个总体都服从正态分布并且有相同的方差。但我们无法证实在实际情况下这些假设是否成立。,2.过多无法证明的假
3、设,15.1 绪论,统计学家对于非参统计没有统一的定义。但有一些是大家都认同的。当一个样本所在的分布仅有有限个参数值未知,其他条件已知时,解决相关问题的方法叫做参数方法。而非参数方法用于除此以外的所有情况,可以在一个很宽泛的假设下仍可以很好的推断出关于概率分布及参数的相关信息。,15.1 绪论,例:当总体服从正态分布,且均值和方差未知时,我们可以运用t检验。因为除了均值和方差两个参数未知外,样本所在分布的其他条件已知,所以说t检验是个参数过程。假设相互独立的样本取自两个总体,而我们要检验两个总体分布是否一致,但分布的形状未知。在这种情况下,分布是不确定的,只能靠非参数方法来检验。,15.1 绪
4、论,对于前面的章节所介绍了参数统计的方法,其有效性是建立在确定的分布假设成立或者至少近似满足的前提下。即使所有的前提都满足,研究表明,非参数统计几乎和参数统计一样能够检测出总体间的差异。而当分布的假设前提不满足时,非参数统计或许往往是测量总体间差异最有效的方法。因此,有很多统计学家都更倾向于使用非参数统计。,15.2 通用两样本移动模型,通常,我们会从两个总体中取得观测值来检验两个总体是否有相同的分布。以正态总体为例。从两个具有相同方差,均值分别为x,y的正态总体中,抽取独立的随机样本X1,X2.Xn1和Y1,Y2.Yn2H0: x-y=0Ha: x-y0,15.2 通用两样本移动模型,如果H
5、0为真,那么两个总体均为正态分布且具有相同的均值和方差,也就是说二者的分布完全相同。如果Ha为真,即xy并且X1与Y1的分布的形状相同,只是Y1的均值位置y比X1的均值x更大。也就是说,Y1的分布相当于是X1的分布向右平移得到的结果。,x,y,平移距离,fx,fy,15.2 通用两样本移动模型,在之前的例子中,除了x,y和2的参数值,分布已经完全确定,也就是说属于参数统计。下面,我们将定义一个可以应用于正态分布和其他分布等任何分布的平移模型。,15.2 通用两样本移动模型,令X1,X2,X3,Xn1为具有分布函数F(x)的总体中的一个随机样本,令Y1,Y2,Yn2为具有分布函数G(x)的总体中
6、的一个随机样本。如果我们想要去检验这两个总体是否具有相同的分布,也就是在F(z),G(z)的分布形状未知的情况下一个假设检验,这时我们就需要利用非参数的方法了。H0 : F(z)=G(z) Ha : F(z)G(z),15.2 通用两样本移动模型,Ha : F(z)G(z)可以转化成下面的形式Y1与平移了(未知的)距离的X1具有相同的分布。这两个分布只是在位置上不同。即对于某个未知的参数,有G(y)=P(Y1y)=P(X1y-)=F(y-),fx,fy,15.3 配对试验的符号秩检验,Sign Test(符号检验)忽略统计过程中的具体数量,仅利用正负号来区分两类样本数据并进行推断。若正负号的数
7、目相差较大,则有理由拒绝原假设,因此又称为正负号检验。Match-pairs(配对样本)独立样本是指我们得到的样本总体之间是相互独立的,比如我们要研究一个地区百姓的生活水平,要同时考察家庭的子女数x,父母的教育水平y,这就可以看到是独立样本。 配对样本则恰恰相反,是指我们得到的样本总体之间是存在相关关系的,比如我们要研究药效y与药物用量x的关系,则(x,y)为配对样本。,符号检验的步骤(1),1)提出假设假设有n对随机选取的独立的配对样本(xi,yi),我们想要检验X和Y的分布是否相同。令Di=xi-yi,P+,P-代表Di为正号,负号出现的概率。由于在原假设成立的情况下Di为正(或为负)的概
8、率等于1/2,则若p=XY,原假设H0:p= 备择假设Ha:p (或者p 或者p )注意:样本容量n是在去除相等的(xi,yi)(称为一个结tie)之后得到的,符号检验的步骤(2),2)确定统计量设M是正号总个数,如果X和Y分布相同,M的选取为n次伯努利实验,服从p=1/2的二项分布:MB(n,1/2)3)拒绝域RRHa:p 时,当M很大时拒绝原假设Ha:p 时,当M很小时拒绝原假设Ha:p 时,当M很大或者很小时拒绝原假设,符号检验的步骤(3),符号检验的大样本情况,N25时可以用正态分布来近似估计二项分布模型符号检验的统计量改为:Z=(M-np)/ npq =(2M-n)/ n N(0,1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四讲 非参数统计 中文版课件 第四 参数 统计 中文版 课件
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-1548785.html