实用多元统计分析.ppt
《实用多元统计分析.ppt》由会员分享,可在线阅读,更多相关《实用多元统计分析.ppt(52页珍藏版)》请在三一办公上搜索。
1、应用统计学精品课程,第十章 实用多元统计分析Unit ten practical multi-dimensional statistical analysis,西安理工大学工程管理系 马斌 余梁蜀Project Management Department of XIAn University of TechnologyMa Bing Yu Liangshu,应用统计学精品课程,10.2,10.3,10.4,判别分析 Distinction analysis,主成分分析 Principal components analysis,因子分析 Factor components analysis,应
2、用统计学精品课程,10.1,聚类分析 Cluster analysis,10.1.1 数据的处理10.1.2 聚类分析中的统计量10.1.3 分类的形成,应用统计学精品课程,应用统计学精品课程,10.1.1 数据的处理在工程项目中,假定对n个样品测定其m个指标,得到以下数据矩阵,其中,Xij是第i个样品j个指标(变量)的观测值。如果各个指标的测量单位、测量结果的数量级及数值变动范围存在很大的差异,我们就有必要在分类之前对数锯进行标准化或正规划。,1)数据的标准化令(i=1,2,;j=1,2,m)其中,通过上述变换的变量Yij是标准化变量,这时,它的均值为0,标准差为1。2)数据的正规化令,应用
3、统计学精品课程,其中,是数据第j列数据中的最小值;是数据阵第j列数据中的最大值;是第j列数据的级差。通过正规化变换后的数据阵中的每一列出现0与1各至少1个,其余则介于0与1之间。聚类分析中的统计量1)样品或指标间相似程度的类型 两个样品或指标对应的的两行(列)对应的元素比较接近,具有成比例关系或互相消长的关系。,应用统计学精品课程,2)衡量样品或指标间相似性的统计量的类型(1)距离系数在实际应用中,常用下式表达作为距离系数 显然,对于正规化的数据,有(,)d(,)越小。第i个变量与第j个变量就越相似;反之,相似性就越小。,应用统计学精品课程,()相似系数 显然,cos ij cos ij绝对值
4、越大,第i个变量的与第j个变量就越相似,反之相反。,应用统计学精品课程,()相关系数 显然,R(i,j)R(i,j)的绝对值越大,第个变量与第个变量之间的关系就越密切;反之,就越不密切。,应用统计学精品课程,分类的形成 原则:()若选出的一对变量未曾连接过,就连结为一组。()若选出的变量对中,有一个已同别的连结成组,则把另一个变量 与这个组连接。()若对选出的变量分别在已连结好的两组内,则把这两个组连结。,应用统计学精品课程,应用统计学精品课程,10.2,判别分析 Distinction analysis,基本思想线性判别函数判别指标与判别法则,应用统计学精品课程,应用统计学精品课程,10.2
5、.1 基本思想 判别函数,记作 Z=Z(Y1,YP)均值同样,对于总体X2有均值,通过判别分析的方法,可以构造出一个介于 和 之间的指标ZC,设Z为某个待定判别的判别值。,应用统计学精品课程,线性判别函数 判别函数 其中,C1,CP是待定系数。通过下式可以确定C1,CP。,应用统计学精品课程,判别指标与判别法则 根据判别函数可求得 和,通常可以用它们的加权平均作为判别指标,即有,应用统计学精品课程,这样我们有以下判别法则:设为某一判别样品的判别值,则,应用统计学精品课程,10.2.4 判别函数的评价 对于判别函数 其有效性需要进行检验。在统计学中,常采用马哈拉诺比斯D2统计量 D2可直观地设想
6、为总体X1和X2之间的距离(称为综合距离系数函数)。可以证明统计量 服从第一自由度为P,第二自由度为n1+n2-p-1的F分布。这样可以查F分布进行检验并评价判别函数。,应用统计学精品课程,实际中,先求出 再求出各判别变量Yt(t=1,p)的贡献系数对“贡献”小的判别变量可根据实际情况筛选掉。,应用统计学精品课程,统计学精品课程,10.3,主成分分析 Principal components analysis,10.3.1 主成份分析10.3.2 主成份的导出10.3.3 主成份的定义主成份的性质应用实例,主成分分析法是多元统计分析中的一种,是一种简化数据结构的方法。它用于将多个变量变换为少数
7、几个综合变量,这几个综合变量变换为少数几个综合变量,这几个综合变量可以反映原来多个变量的大部分信息,而它们相互之间又是无关的。,统计学精品课程,主成分的概念 在项目管理中,假定对n个样品测定其m个指标(变量)X1,Xm得以下数据矩阵 以后我们将原指标记为X1,Xm,将它们的主成分记为Y1,Ym.当m=2时,原指标记为X1和X2,其关系见下页图,应用统计学精品课程,容易看出Y1将X1和X2,的主要信息都反映了。那么用Y1来表达X1和X2,还是不错的。如果取椭圆的短轴作为第二主成分Y2,那么,图10.2上的点,对原指标X1,X2,的值记为X1t和Xt2(t=1,n),对主成分Y2的值记为Y1t,Y
8、t2(t=1,n),则有,应用统计学精品课程,所谓Y1反映的信息,就是 在整个平方和中所占的比例越大越好,即Y1的平方和(或方差)越大越好。主成分的导出 在标准化的情况下,样本的相关系数即为样本协方差,即,应用统计学精品课程,对于数据矩阵(10.1),其样本相关矩阵R和样本协方差矩阵S相同,即为了导出主成分,只须求R或S阵的特征根和特征向量即可。,应用统计学精品课程,主成分的定义设为X1,Xm是m个变量,可以抽得其n个样品,它的第i(i=1,m)个主成分为其中,,应用统计学精品课程,并且满足:(1)第一主成分Y1是一切形如 使Y的方差达到极大者。(2)第二主成分Y2是一切形如并与Y1无关,使Y
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 实用 多元 统计分析

链接地址:https://www.31ppt.com/p-5257988.html