哈尔滨工业大学 多元统计分析 数学建模必备 葛虹ppt课件.ppt
《哈尔滨工业大学 多元统计分析 数学建模必备 葛虹ppt课件.ppt》由会员分享,可在线阅读,更多相关《哈尔滨工业大学 多元统计分析 数学建模必备 葛虹ppt课件.ppt(120页珍藏版)》请在三一办公上搜索。
1、多 元 统 计 分 析,哈尔滨工业大学数学系 葛 虹,多元统计分析内容简介,第一章 多元统计的基本概念第二章 主成分分析第三章 聚类分析第四章 多元正态分布第五章 多元回归分析,第一章 多元统计的基本概念,第一节 随机向量 及其数字特征,随机向量极其分布,P维随机向量: 联合分布函数: 联合密度函数:,特征函数,一元随机变量 :二元随机向量 :P元随机向量例1,条件分布与独立性,两随机向量间的条件分布 的D.F: ; d.f ; c.f 的D.F: ; d.f ;c.f 的D.F: ; d.f ;c.f 给定 , 的条件密度函数:,两随机向量独立的充分必要条件 与 相互独立,随机向量的数字特征
2、,随机向量的数学期望随机向量的方差阵,两随机向量间的协方差阵随机向量的相关系数阵,随机向量的数字特征的计算性质,对称,非负定;,例2求:,第二节 随机向量的样本 及其数字特征,P维随机样本 P维随机向量 的一个容量为n的样本:,的样本,的样本,的样本,样本均值,样本离差阵与样本方差阵,样本离差阵,样本方差阵,样本相关系数阵,与 的样本相关系数,作 业 一,1 令 (1)求c;(2)求 ;(3)证明: ;(4) 是否相互独立?,2 设三个随机变量x,y,z的联合密度函数为:(1)求常数k;(2)x,y,z是否相互独立?(3)试求在给定y=1/2 ,z=1的条件下x的分布。,3 设随机向量 的协方
3、差阵为:(1)求相关系数阵;(2)令 , ,求 的协方差阵。,实验报告一,选择一组多维有意义的数据编写SAS数据文件利用SAS作单变量的置方图,计算基本统计特征(均值、方差或标准差)并由此分析单变量的基本分布情况利用SAS计算多维随机变量的样本协方差阵、样本相关系数阵并由此分析变量之间的相关性要求打印 SAS数据文件 置方图 计算结果 分析结果,第二章 主成分分析,第一节 为什么要进行主成分分析,消除自变量间的相关性与多维变量降维 满足(1) (2),第二节 数学模型与理论主成分,前提条件: 目标:寻找正交矩阵 使 (1) (2) 且结论: 是 的特征值; 的行向量分别为相应的特征向量;,理论
4、主成分的计算过程,求非负定阵 的特征值:求 所对应的单位特征向量:写出主成分:,第三节 样本主成分的计算过程,首先将原始数据标准化得到标准化数据(消除量纲影响);求标准化数据的样本协方差阵 (该矩阵是原样本数据的样本相关系数阵) ;求 的特征值 和所对应的单位特征向量:,写出p个主成分的表达式: 是样本均值, 是样本标准差,选择主成分的方法,贡献率:第i 个主成分的贡献率为累积贡献率:前m 个主成分的累积贡献率为选择法则: 保留m 个主成分,第四节 主成分的应用,利用第一主成分进行综合评价 若第一主成分满足:(1) 其中(2)第一主成分的贡献率 ,则 可以作为一个综合评价指标,利用第一、二个主
5、成分进行分类若第一、二个主成分的累积贡献率 ,则由第一、二个主成分在平面上的散点图,可以对样品进行分类。,实验二 主成分分析,选取一组有意义的P维数据利用SAS的“交互数据分析”对P维变量进行主成分分析,并选择主成分进行排序与分类。要求说明:1)主成分选择原理 2)所选择主成分的表达式 3)最后的排序与分类结果。,第三章 聚类分析,第一节 p维空间中的距离欧氏距离马氏距离B模距离 明氏距离,一点到总体的马氏距离,第二节 聚类方法简介,问题:将n个p维样本分成m个类系统聚类法与聚类步骤流程图动态聚类法与聚类步骤流程图,系统聚类法与聚类步骤流程图,初始分类:,若 与 距离最小,合并为一类,no,输
6、出分类结果,动态聚类法与聚类步骤流程图,寻找m个凝聚点:,若 则 ;得,计算各类的重心:,若 则 ;得,计算各类的重心:,重心改变,输出分类结果,yes,no,第三节 五种系统聚类(cluster)方法,最短距离法(method=single)最长距离法(method=complete)重心法(method=centroid),类平均法(method=average)离差平方和法(method=ward),可以证明:半偏,第四节 系统聚类在SAS中的实现,proc cluster data=city method=ward outtree=DD;Var x1-x8;id region;proc
7、 tree data=DD horizontal graphics;id region;title tree of cluster;run;,实验三 聚类分析,选取一组有实际意义的数据利用SAS的五种系统聚类方法将n个样本进行分类,要求:1)说明每一种方法的分类结果2)利用主成分分析说明哪一种分类结果更合理,第四章 多元正态分布,第一节 多元正态分布第二节 多元正态分布的函数-卡方分布第三节 多元正态分布的参数估计第四节 WISHART分布第五节 正态分布均值向量的假设检验,一元正态分布,一元正态分布,密度函数形式,特征函数形式,一般正态与标准正态之间的关系,多个正态变量的线性组合仍为正态变量
8、,第一节 多元正态分布,定义1 q维标准正态分布 设 独立同分布于 ,则称随机向量 服从q 维正态分布,记 密度函数: 特征函数:,定义2 p 维一般正态分布 设 ,B为 实数矩阵, 为 维实数向量,则 是 维随机正态分布,记为: 其中 为非负定阵。,定理1 若 服从 ,则 (1) , (2),定理2 若 服从 (1)令 , 为 , 为 则 服从 (利用特征函数证明) (2) 服从,定理3 若 服从 ,(1) 服从 , 服从 ;(2) 与 相互独立 (简化成 服从 , 服从 的情形,通过特征函数证明)推论:若 不服从正态分布,则 不服从正态分,用于验证,定理4 服从 为一元正态随机变量定理5
9、若 为正定矩阵,则 服从 具有密度函数(证明要点: , ),用于验证,多元正态分布的四个等价定义,其中 为一元正态随机变量 特征函数 密度函数,多用于验证,多用于证明,第二节 多元正态分布的函数-卡方分布,定义1 中心 分布与矩阵表达设 独立同分布于 ,则若记 ,且 则,定义2 非中心 分布与矩阵表达设 ,且 ,则 服从自由度为p,非中心参数为的卡方分布,并记为:,定理1 若 服从 ,且 正定,则 (1) 服从 ,其中 (2) 服从,用于构造检验统计量并检验异常点,定理2 设 服从 , 服从 且相互独立,则 服从 定理3 设 服从 , 为 阶实对称阵且 ,则 服从 其中(对称幂等阵的性质:1.
10、 I-A是对称幂等的;2.A的特征值是1或0;3. R(A)=tr(A),证明要点: 若A是对称幂等的,则存在正交矩阵Q 使 若 服从 A是非负定阵 存在一个矩阵 ,R(B)=r,且,定理4 (Cochran定理)已知 (1) 服从 (2) 为 阶实对称阵;且 (3) 则 服从 与 服从 且相互独立 (要点: ),定理5 设(1)(2) , (3) 非负定则 且与 相互独立,作业二(1),若 服从(1)求 的分布,其中:(2)X中有无相互独立的分量?(3) 的分布是什么?若 服从 ,A与B分别是 和 阶实矩阵,证明:AX与BX相互独立,一元正态样本及其性质,设 是来自 的一个样本样本均值是总体
11、均值的无偏估计,即 ;样本方差是总体方差的无偏估计,即 ;,与 分别是 和 的极大似然估计其中 与 相互独立,第三节 多元正态分布的参数估计,定理1 若 为正定矩阵且 ,则 为 的极大似然估计,即 定理2 当 时, 的极大似然估计是,定理3 与 分别是 和 的无偏估计,即定理4 若 和 分别是正态总体 的样本均值和样本离差阵,则 (1) 与 相互独立,(2) ; 与 同分布 其中 独立同分布于(3) 定理5 若 为正定矩阵,则 ,可作为检验统计量,?,第四节 WISHART分布,定义1 随机矩阵的分布定义2 (Wishart分布)设服从且相互独立,则称随机矩阵服从中心Wishart 分布,并记
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 哈尔滨工业大学 多元统计分析 数学建模必备 葛虹ppt课件 多元 统计分析 数学 建模 必备 葛虹 ppt 课件

链接地址:https://www.31ppt.com/p-1894021.html