欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    1.3多维数据的数字特征及相关分析.ppt

    • 资源ID:6004120       资源大小:1.22MB        全文页数:35页
    • 资源格式: PPT        下载积分:10金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要10金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    1.3多维数据的数字特征及相关分析.ppt

    1,1.3 多维数据的数字特征及相关分析,2,1.3 多维数据的数字特征及相关分析,基本内容,均值 协方差Pearson相关系数 Spearman相关系数,p维总体均值向量协方差矩阵 相关系数矩阵随机向量的性质多维正态分布,观测数据协方差 Pearson相关矩阵 Spearman相关矩阵proc corr过程实现,1.3.1 二维数据的数字特征及相关系数,1.3.3 多维数据的数字特征及相关矩阵,1.3.2 多维总体的数字特征、相关矩阵及多维正态分布,3,1.3 多维数据的数字特征及相关分析,均值 协方差Pearson相关系数 Spearman相关系数,1.3.1 二维数据的数字特征及相关系数,4,复习:数据的分布,直方图、经验分布函数、QQ图、茎叶图,5,一.二维总体的数字特征及相关系数,1.3.1 二维数据的数字特征及相关系数,6,二维数字特征的性质,当X与Y相互独立时,,(3),(2),(1),1.3.1 二维数据的数字特征及相关系数,7,二观测数据协方差、相关系数、检验,样本协方差,样本协方差矩阵,样本均值,样本方差,1.3.1 二维数据的数字特征及相关系数,观测矩阵,1.3.1 二维数据的数字特征及相关系数,总体(X,Y)T,样本,8,Pearson相关系数,Pearson相关系数矩阵,注:1.Pearson相关系数反映 两随机变量线性相关强 弱,散点图见书图1.11.2.由Schwarz不等式知,1.3.1 二维数据的数字特征及相关系数,二观测数据协方差、相关系数、检验,3.n充分大时,,9,当(X,Y)T 为二维正态,二维随机变量相关性检验,观测数据,假设检验,统计量,认为|t|过大,拒绝假设,认为X与Y相关.,检验p值,给定,当,拒绝H0.认为X与Y相关;否则,不相关.,1.3.1 二维数据的数字特征及相关系数,二观测数据协方差、相关系数、检验,10,1秩统计量,三Spearman相关系数,秩统计量:,例 观测值-0.8,-3.1,1.1,-5.2 4.2,如-0.8,-3.1,-0.8秩统计量 2,1,3 或 3,1,2记为 2.5 1,2.5,秩统计量,规定:相同观测值,秩统计量取排序的平均值。,1.3.1 二维数据的数字特征及相关系数,11,注:当X,Y相关性较强,两组秩统计量相关性也较强,2Spearman相关系数,秩统计量分别为,Spearman相关系数:,1.3.1 二维数据的数字特征及相关系数,12,基于Spearman相关系数的假设检验,统计量,检验P值,1.3.1 二维数据的数字特征及相关系数,13,四SAS系统 proc corr过程,1.3.1 二维数据的数字特征及相关系数,14,四SAS系统 proc corr过程,解:程序data examp1_9;input x y;cards;68 971 63 892 70 1125 6 82 65 931 9 112 10 162 12 321 20 315 30 375 33 462 27 352 21 305 5 84 14 229 27 332 17 185 53 703 62 872 65 740;run;proc corr data=examp1_9 pearson spearman cov;/*方差描述性过程,输出Pearson,Spearman相关矩阵,协方差阵*/run;,1.3.1 二维数据的数字特征及相关系数,15,例1.9结果输出 CORR 过程 2 变量:x y 协方差矩阵S,自由度n-1=19 x y x 570.4500 7845.0789 y 7845.0789 112404.2632 简单统计量 变量 N 均值 标准偏差 中位数 最小值 最大值 x 20 33.85000 23.88410 27.00000 5.00000 70.00000 y 20 477.50000 335.26745 342.00000 82.00000 1125,Spearman 相关系数,N=20 当 H0:Rho=0 时,Prob|r|x y x 1.00000=0.97366 p.0001 y 0.97366 1.00000.0001,Pearson 相关系数,N=20 当 H0:Rho=0 时,Prob|r|x y x 1.00000=0.97971 相关性显著 p.0001 y 0.97971 1.0001,1.3.1 二维数据的数字特征及相关系数,16,结果分析:,(1)利用proc corr过程,得,(2)数据的Pearson相关系数,(3)数据的Spearman相关系数,检验p值均,X与Y的相关性高度显著.,1.3.1 二维数据的数字特征及相关系数,17,1.3 多维数据的数字特征及相关分析,观测数据协方差 Pearson相关矩阵 Spearman相关矩阵proc corr过程实现,1.3.2 多维总体的数字特征、相关矩阵及多维正态分布,18,1.3.2 多维总体数字特征、相关矩阵及正态分布,一.p维总体的数字特征、相关系数矩阵,分布函数,p维总体,连续总体概率密度,均值向量:,总体协方差矩阵:,19,总体相关矩阵:,1.3.2 多维总体数字特征、相关矩阵及正态分布,20,二随机向量的性质,(1)A 常量矩阵,常向量,则,(2)B 常量矩阵,1.3.2 多维总体数字特征、相关矩阵及正态分布,21,三多维正态分布,1二维正态分布及性质,其中,1.3.2 多维总体数字特征、相关矩阵及正态分布,22,2.p维正态分布,p维正态分布,密度,协方差阵,均值向量,1.3.2 多维总体数字特征、相关矩阵及正态分布,23,(1)线性组合为正态分布,(2)分量为正态分布,(3)分量独立 不相关,3.多维正态分布性质,1.3.2 多维总体数字特征、相关矩阵及正态分布,24,1.3 多维数据的数字特征及相关分析,观测数据协方差 Pearson相关矩阵 Spearman相关矩阵proc corr过程实现,1.3.3 多维数据的数字特征及相关矩阵,25,一样本观测数据的协方差、相关矩阵,p维总体:,数据的协方差、方差,均值向量,样本协方差矩阵,样本观测数据矩阵,1.3.3 多维数据的数字特征及相关分析,26,1.3.3 多维数据的数字特征及相关分析,Pearson相关系数矩阵,Spearman相关系数矩阵,27,注意:1.原数据的相关系数矩阵即为标准化数据协方差阵.,标准化数据矩阵:,2.n充分大时,有,对Xj数据标准化,得标准化数据矩阵;每行为标准化后样品观测向量,1.3.3 多维数据的数字特征及相关分析,28,例1.10 测20个3个生理指标:体重(X1)、腰围(X2)、脉搏(X3);3个训练指标:引体向上(X4)、仰卧起坐(X5)、跳跃(X6)次数.数据见书表1.2:解:程序:,二SAS系统 proc corr过程,data exam1_10;input x1-x6;cards;191 36 50 5 162 60156 33 54 15 225 73138 33 68 2 110 43;,proc corr data=exam1_10 cov pearson spearman;/*调用Corr过程,输出协方差,Pearson,Spearman相关系数矩阵*/var x1-x6;run;,1.3.3 多维数据的数字特征及相关分析,29,(1)计算观测数据均值向量、协方差阵、Pearson相关阵,CORR 过程 6 变量:x1 x2 x3 x4 x5 x6 简单统计量 变量 N 均值 标准偏差 中位数 最小值 最大值 x1 20 178.60000 24.69051 176.00000 138.00000 247.00000 x2 20 35.40000 3.20197 35.00000 31.00000 46.00000 x3 20 56.10000 7.21037 55.00000 46.00000 74.00000 x4 20 9.45000 5.28628 11.50000 1.00000 17.00000 x5 20 145.55000 62.56658 122.50000 50.00000 251.00000 x6 20 70.30000 51.27747 54.00000 25.00000 250.00000,1.3.3 多维数据的数字特征及相关分析,30,样本协方差矩阵S,自由度=19=样本个数-1 x1 x2 x3 x4 x5 x6x1 609.62105 68.80000-65.11578-50.86316-761.71578-286.50526x2 68.800000 10.252632-8.147368-9.347368-129.336842-31.442105x3-65.115789-8.147368 51.989474 5.742105 101.521053 12.915789x4-50.863158-9.347368 5.742105 27.944737 230.107895 134.384211x5-761.715789-129.33684 101.521053 230.107895 3914.57632 2146.98421x6-286.505263-31.442105 12.915789 134.38421 2146.98421 2629.37895,1.3.3 多维数据的数字特征及相关分析,31,Pearson相关系数矩阵R Pearson 相关系数,N=20 当 H0:Rho=0 时,Prob|r|x1 x2 x3 x4 x5 x6 x1 1.00000=0.87024-0.36576-0.38969-0.49308-0.22630 相关性好 p12.0001 0.1128 0.0894 0.0272 0.3374 x2 0.87024 1.00000-0.35289-0.55223-0.64560-0.19150.0001 0.1270 0.0116 0.0021 0.4186 x3-0.36576-0.35289 1.00000 0.15065 0.22504 0.03493 0.1128 0.1270 0.5261 0.3401 0.8838 x4-0.38969-0.55223 0.15065 1.00000 0.69573 0.49576 0.0894 0.0116 0.5261 0.0007 0.0262 x5-0.49308-0.64560 0.22504 0.69573 1.00000 0.66921 0.0272 0.0021 0.3401 0.0007 0.0013 x6-0.22630-0.19150 0.03493 0.49576 0.66921 1.00000 0.3374 0.4186 0.8838 0.0262 0.0013,1.3.3 多维数据的数字特征及相关分析,32,Spearman 相关系数,N=20 当 H0:Rho=0 时,Prob|r|x1 x2 x3 x4 x5 x6 x1 1.00000 0.81423-0.37070-0.38020-0.57774-0.19902.0001 0.1076 0.0982 0.0076 0.4002 x2 0.81423 1.00000-0.23770-0.54190-0.72473-0.19940.0001 0.3129 0.0136 0.0003 0.3993 x3-0.37070-0.23770 1.00000 0.13662 0.17924 0.09841 0.1076 0.3129 0.5657 0.4496 0.6798 x4-0.38020-0.54190 0.13662 1.00000 0.65620 0.32263 0.0982 0.0136 0.5657 0.0017 0.1653 x5-0.57774-0.72473 0.17924 0.65620 1.00000 0.69521 0.0076 0.0003 0.4496 0.0017 0.0007 x6-0.19902-0.19940 0.09841 0.32263 0.69521 1.00000 0.4002 0.3993 0.6798 0.1653 0.0007,(2)Spearman相关矩阵,1.3.3 多维数据的数字特征及相关分析,33,由Pearson相关系数矩阵输出结果,取显著水平,则,(3)分析各指标间的相关性,检验值均满足p0.1,接受原假设,认为各相应随机变量对相关性很小,认为0.类似,Pearsman相关系数矩阵的下列检验值p0.1,1.3.3 多维数据的数字特征及相关分析,34,35,概念总结(纸质作业):1.一位数据的数字特征哪些?写出公式,说明作用.2.说出数据的几种图形表示法,正态性的检验方法(统计量、检验p值、判断).3.写出多维数据的数字特征、多维总体的数字特征及性质、多维正态分布密度.,作业 1.5 1.6,

    注意事项

    本文(1.3多维数据的数字特征及相关分析.ppt)为本站会员(sccc)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开