多元统计.ppt
《多元统计.ppt》由会员分享,可在线阅读,更多相关《多元统计.ppt(65页珍藏版)》请在三一办公上搜索。
1、课程提纲(Syllabus),教师 张青 公共邮箱:bjfu_stat,密码:123456 办公地点:理学院楼二层东侧203 ftp:/202.204.125.135 user:math;pass:math 成绩评定 平时:40%课外文献阅读 考试:60%教学安排 多元正态分布;聚类分析;判别分析;主成分分析;因子分析;典型相关;回归分析;假设检验,中文参考书 1 多元统计分析 何晓群 编 人民大学大出版社 2008 2 应用多元统计分析 高惠璇 编 北京大学出版社 2005 3 多元统计分析选讲 张饶庭 著 中国统计出版社 2002 4 多元统计分析(研究生)袁志发 科学出版社外文参考书 1
2、 Applied Multivariate Statistical Analysis(5th Ed)2003 Richard A.Johnson Dean W.Wichern China Statistics Press(国外MBA优秀教材)2 Analyzing Multivariate Data 2003 Lattin Carroll Green China Machine Press(斯坦福大学,罗格斯大学,宾夕法尼亚)3 Applied Multivariate Methods for Data Analysts 2005 Dallase E.Johnson Higher Educat
3、ion Press(海外优秀数学类教材)参考文献 本专业研究生博士生论文,相关专业的文献,生命科学社会科学,统计分析方法,现象多样性重复性复杂性随机性,多元统计分析方法,多元回归分析方法多元判别分析方法聚类分析方法,目的从看起来杂乱无章的数据中发现提炼规律性的结论,必备的知识良好的专业训练必要的统计分析工具,Statistics is much too important to be left entirely to statisticians-George Box,传统方法与多变量分析方法区别:,Traditional statistical methods:State some hypot
4、hese Collect some data Substantiate or repudiate the hypothesesMultivariate techniques:Exploring data in order to find worthwhile and valuable informationMultivariate methods:“variable-directed”techniques“individual-directed”techniques,An Overview of multivariate methods“variable-directed”“individua
5、l-directed”,Principal components 主成分分析Factor analysis 因子分析Regression analysis 回归分析Canonical correlation analysis 典型相关分析,Cluster analysis 聚类分析Discriminant analysis 判别分析Multivariate analysis of variance 方差分析,2023/6/8,6,第一章 多元正态分布,目录 上页 下页 返回 结束,1.1 多元分布的基本概念,1.2 统计距离和马氏距离,1.3 多元正态分布,1.4 均值向量和协方差阵的估计,1
6、.5 常用分布及抽样分布,2023/6/8,7,第一章 多元正态分布,一元正态分布在统计学的理论和实际应用中都有着重要的地位。同样,在多变量统计学中,多元正态分布也占有相当重要的位置。原因是:许多随机向量确实遵从正态分布,或近似遵从正态分布;对于多元正态分布,已有一整套统计推断方法,并且得到了许多完整的结果。,目录 上页 下页 返回 结束,2023/6/8,8,1.1多元分布的基本概念,目录 上页 下页 返回 结束,1.1.1 随机向量,1.1.2 分布函数与密度函数,(1.1.3 多元变量的独立性),1.1.4 随机向量的数字特征,2023/6/8,9,1.1.1 随机向量,表示对同一个体观
7、测的 个变量。若观测了 个个体,则可得到如下表1-1的数据,称每一个个体的 个变量为一个样品,而全体 个样品形成一个样本。,假定所讨论的是多个变量的总体,所研究的数据是同时观测 个指标(即变量),又进行了 次观测得到的,把这 个指标表示为 常用向量,目录 上页 下页 返回 结束,2023/6/8,10,横看表1-1,记,它表示第 个样品的观测值。竖看表1-1,第 列的元素 表示对 第个变量 的n次观测数值。下面为表1-1,目录 上页 下页 返回 结束,1.1.1 随机向量,2023/6/8,11,因此,样本资料矩阵可用矩阵语言表示为:,目录 上页 下页 返回 结束,1.1.1 随机向量,若无特
8、别说明,本书所称向量均指列向量,定义1.1 设 为 n 个随机变量,由它们组成的向量 称为随机向量。,2023/6/8,12,定义1.2 设 X 是一随机向量,它的多元分布函数是,1.1.2 分布函数与密度函数,描述随机变量的最基本工具是分布函数,类似地描述随机向量的最基本工具还是分布函数。,目录 上页 下页 返回 结束,2023/6/8,17,1.1.2 分布函数与密度函数,目录 上页 下页 返回 结束,定义1.3:设=,若存在一个非负的函数,使得,对一切 成立,则称(或)有分布密度 并称 为连续型随机向量。,一个 p 维变量的函数 能作为p维空间 中某个随机向量的分布密度,当且仅当,202
9、3/6/8,19,1.1.3 多元变量的独立性,目录 上页 下页 返回 结束,注意:在上述定义中,和 的维数一般是不同的。,若 有密度,用 分别表示 和 的分布密度,则 和 独立当且仅当(1.5),2023/6/8,20,1.1.4 随机向量的数字特征,目录 上页 下页 返回 结束,当 为常数矩阵时,由定义可立即推出如下性质:,1、随机向量 X 的均值 设 有p 个分量。若 存在,定义随机向量X的均值为,Then,2023/6/8,22,1.1.4 随机向量的数字特征,目录 上页 下页 返回 结束,2、随机向量 自协方差阵,称它为 维随机向量 的协方差阵,简称为 的协方差阵。称 为 的广义方差
10、,它是协差阵的行列式之值。,2023/6/8,23,目录 上页 下页 返回 结束,1.1.4 随机向量的数字特征,3、随机向量X 和Y 的协差阵,设 分别为 维和 维随机向量,它们之间的协方差阵定义为一个 矩阵,其元素是,即,当A、B为常数矩阵时,由定义可推出协差阵有如下性质:,2023/6/8,25,目录 上页 下页 返回 结束,1.1.4 随机向量的数字特征,4、随机向量X 的相关阵 若随机向量 的协差阵存在,且每个分量的方差大于零,则X的相关阵定义为:,也称为分量 与 之间的(线性)相关系数。,2023/6/8,26,在数据处理时,为了克服由于指标的量纲不同对统计分析结果带来的影响,往往
11、在使用某种统计分析方法之前,常需将每个指标“标准化”,即做如下变换,目录 上页 下页 返回 结束,1.1.4 随机向量的数字特征,2023/6/8,28,1.2 统计距离和马氏距离,目录 上页 下页 返回 结束,欧氏距离,马氏距离,2023/6/8,29,1.2 统计距离和马氏距离,欧氏距离,在多指标统计分析中,距离的概念十分重要,样品间的不少特征都可用距离去描述。大部分多元方法是建立在简单的距离概念基础上的。即平时人们熟悉的欧氏距离,或称直线距离.如几何平面上的点p=(x1,x2)到原点O=(0,0)的欧氏距离,依勾股定理有,目录 上页 下页 返回 结束,2023/6/8,30,1.2 统计
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 统计

链接地址:https://www.31ppt.com/p-5147931.html