多维数据的数字特征及相关分析.ppt
《多维数据的数字特征及相关分析.ppt》由会员分享,可在线阅读,更多相关《多维数据的数字特征及相关分析.ppt(29页珍藏版)》请在三一办公上搜索。
1、2023/5/26,1,复习 1.2 数据的分布,2023/5/26,2,1.3 多维数据的数字特征及相关分析,基本内容,二维总体数字特征 观测数据协方差Pearson相关系数 Spearman相关系数 SAS系统 corr过程,p维总体数字特征 相关系数矩阵随机向量的性质多维正态分布,观测数据协方差 Pearson相关矩阵 Spearman相关矩阵proc corr过程,1.3.1 二维数据的数字特征及相关系数,1.3.3 多维数据的数字特征及相关矩阵,1.3.2 多维总体的数字特征、相关矩阵及多维正态分布,2023/5/26,3,一.二维数据的数字特征及相关系数,总体(X,Y)T分布函数F
2、(x,y),方差 Var(X),Var(Y),协方差Cov(X,Y),相关系数,1.3.1 二维数据的数字特征,称不相关,2023/5/26,4,当X与Y相互独立时,,二维数字特征的性质,(1),(2),(3),2023/5/26,5,二观测数据的协方差、Pearson相关系数,总体(X,Y)T,观测数据,1观测数据的协方差,观测矩阵,样本方差、协方差,均值,,,2023/5/26,6,由Schwarz不等式知,注意:,散点图见书图1.11,协方差矩阵,为对称非负定,2观测数据的Pearson相关系数,Pearson相关系数,(Schwaraz不等式),2023/5/26,7,可证,当(X,Y
3、)T 为二维正态,3二维随机变量相关性检验,n充分大时,观测数据,假设检验,统计量,如|t|过大,拒绝假设,认为X与Y相关.拒绝域,检验p值,给定,当,拒绝H0.认为X与Y相关,Pearson相关系数反映两变量线性关联性的强弱.否则,认为不相关.,2023/5/26,8,1秩统计量,三Spearman相关系数,总体X,观测值,定义:秩统计量,观测值-0.8,-3.1,1.1,-5.2 4.2次序统计量-5.2,-3.1,-0.8,1.1,4.2,如-0.8,-3.1,-0.8秩统计量 2,1,3 或 3,1,2记为 2.5 1,2.5,秩统计量 3,2,4,1,5,次序统计量,注意:为保证秩统
4、计量唯一性,规定:相同观测值,秩统计量取应排序的平均值。,2023/5/26,9,分量X,Y的一元样本数据,当X,Y相关性较强,则两组秩统计量相关性也较强,2Spearman相关系数,总体(X,Y)T,观测数据,秩统计量分别是,定义:Spearman相关系数,其中,计算得,2023/5/26,10,基于Spearman相关系数的假设检验,统计量,给定,当,拒绝H0.否则,接受H0认为不相关.,检验P值,四SAS系统 proc corr过程,2023/5/26,11,例1.9,20个随机选取的黄麻个体植株,记录青植株重量Y与干植株重量X.设(X,Y)T服从正态分布,数据:,(1)求二维观测数据均
5、值向量 和协方差矩阵;(2)计算Pearson相关系数并检验假设;,解:,(3)计算Spearman相关系数并检验上述假设.,x 68 63 70 6 65 9 10 12 20 30 33 27 21 5 14 27 17 53 62 65y 971 892 1125 82 931 112 163 321 315 375 462 352 305 84 229 332 185 703 872 740,data examp1_9;input x y;cards;68 971 63 892 70 1125 6 82 65 931 9 112 10 162 12 321 20 315 30 375
6、33 462 27 352 21 305 5 84 14 229 27 332 17 185 53 703 62 872 65 740;run;proc corr data=examp1_9 pearson spearman cov;/*方差描述性过程,输出Pearson Spearman相关矩阵,协方差阵*/run;,2023/5/26,12,例1.9结果输出 CORR 过程 2 变量:x y 协方差矩阵S,自由度n-1=19 x y x 570.4500 7845.0789 y 7845.0789 112404.2632 简单统计量 变量 N 均值 标准偏差 中位数 最小值 最大值 x 2
7、0 33.85000 23.88410 27.00000 5.00000 70.00000 y 20 477.50000 335.26745 342.00000 82.00000 1125,Spearman 相关系数,N=20 当 H0:Rho=0 时,Prob|r|x y x 1.00000=0.97366.0001 y 0.97366 1.00000.0001,Pearson 相关系数,N=20 当 H0:Rho=0 时,Prob|r|x y x 1.00000=0.97971 相关性显著 p.0001 y 0.97971 1.0001,Spearman 相关系数,N=20 当 H0:Rh
8、o=0 时,Prob|r|x y x 1.00000=0.97366 相关性显著 p.0001 y 0.97366 1.00000.0001,2023/5/26,13,结果分析:,(1)利用proc corr过程,得,(2)数据的Pearson相关系数,(3)数据的Spearman相关系数,检验p值均,X与Y的相关性高度显著.,2023/5/26,14,1.3.2 多维总体的数字特征、相关矩阵及多维正态分布,一.p维总体的数字特征、相关系数矩阵,分布函数,p维总体,连续总体概率密度,均值向量,总体协方差矩阵,2023/5/26,15,注意:1.为 的相关系数 2.总是非负定的。,总体相关矩阵,
9、记,则,2023/5/26,16,二随机向量的性质,(1)A 常量矩阵,常向量,则,(2)B 常量矩阵,2023/5/26,17,三多维正态分布,1二维正态分布及性质,其中,2023/5/26,18,2.p维正态分布,服从p维正态分布,密度,协方差阵,均值向量,2023/5/26,19,(1)线性组合为正态分布,(2)分量为正态分布,(3)分量独立 不相关,多维正态分布性质,为 最大似然估计,独立,2023/5/26,20,一样本观测数据的协方差、相关矩阵,p维总体:,数据的协方差、方差,均值向量,协方差矩阵,样本观测数据矩阵,多维数据的数字特征及相关矩阵,2023/5/26,21,相关系数,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多维 数据 数字 特征 相关 分析
链接地址:https://www.31ppt.com/p-4970145.html