高级统计学1.多元正态分布.ppt
《高级统计学1.多元正态分布.ppt》由会员分享,可在线阅读,更多相关《高级统计学1.多元正态分布.ppt(66页珍藏版)》请在三一办公上搜索。
1、第一章 多元正态分布,目录 上页 下页 返回 结束,1.1 多元分布的基本概念,1.2 统计距离,1.3 多元正态分布,1.4 均值向量和协方差阵的估计,1.5 常用分布及抽样分布,第一章 多元正态分布,一元正态分布在统计学的理论和实际应用中都有着重要的地位。同样,在多变量统计学中,多元正态分布也占有相当重要的位置。原因是:许多随机向量确实遵从正态分布,或近似遵从正态分布;对于多元正态分布,已有一整套统计推断方法,并且得到了许多完整的结果。,目录 上页 下页 返回 结束,第一章 多元正态分布,多元正态分布是最常用的一种多元概率分布。除此之外,还有多元对数正态分布,多项式分布,多元超几何分布,多
2、元 分布、多元 分布、多元指数分布等。本章从多维变量及多元分布的基本概念开始,着重介绍多元正态分布的定义及一些重要性质。,目录 上页 下页 返回 结束,第一章 多元正态分布,多元分布的基本概念统计距离多元正态分布均值向量和协方差阵的估计常用分布及抽样分布,目录 上页 下页 返回 结束,1.1多元分布的基本概念,目录 上页 下页 返回 结束,1.1.1 随机向量,1.1.2 分布函数与密度函数,1.1.3 多元变量的独立性,1.1.4 随机向量的数字特征,6,1.1.1 随机向量,表示对同一个体观测的 个变量。若观测了 个个体,则可得到如下表1-1的数据,称每一个个体的 个变量为一个样品,而全体
3、 个样品形成一个样本。,假定所讨论的是多个变量的总体,所研究的数据是同时观测 个指标(即变量),又进行了 次观测得到的,把这 个指标表示为 常用向量,目录 上页 下页 返回 结束,记它表示第个样品的观测值。竖看表1-1,第j列的元素表示对第j个变量Xj的n次观测数值。,目录 上页 下页 返回 结束,1.1.1 随机向量,8,因此,样本资料矩阵可用矩阵语言表示为:,定义1.1 设 为 个随机变量,由它们组成的向量 称为随机向量。,目录 上页 下页 返回 结束,1.1.1 随机向量,若无特别说明,本书所称向量均指列向量,9,定义1.2 设 是一随机向量,它的多元分布函数是,式中,,并记成。,分布函
4、数与密度函数,描述随机变量的最基本工具是分布函数,类似地描述随机向量的最基本工具还是分布函数。,目录 上页 下页 返回 结束,10,分布函数与密度函数,目录 上页 下页 返回 结束,定义1.3:设=,若存在一个非负的函数,使得,对一切 成立,则称(或)有分布密度 并称 为连续型随机向量。,一个 维变量的函数 能作为 中某个随机向量的分布密度,当且仅当,11,多元变量的独立性,目录 上页 下页 返回 结束,注意:在上述定义中,和 的维数一般是不同的。,(1)若F(x,y)为(X,Y)的联合分布函数,G(x)和H(y)分别为X和Y的分布函数,则X与Y独立当且仅当,(2)若(X,Y)有密度f(x,y
5、),用g(x)和h(y)分别表示X和Y的分布密度,则X和Y独立当且仅当,12,1.1.4 随机向量的数字特征,是一个 维向量,称为均值向量.,目录 上页 下页 返回 结束,当A、B为常数矩阵时,由定义可立即推出如下性质:,1、随机向量 的均值 设 有 个分量。若 存在,定义随机向量 的均值为,13,1.1.4 随机向量的数字特征,目录 上页 下页 返回 结束,2、随机向量X的协方差阵,称它为p维随机向量X的协方差阵,简称为X的协方差阵。称|cov(X,X)|为X的广义方差,它是协差阵的行列式之值。,目录 上页 下页 返回 结束,1.1.4 随机向量的数字特征,3、随机向量X 和Y 的协差阵,设
6、 分别为 维和 维随机向量,它们之间的协方差阵定义为一个 矩阵,其元素是,即,当A、B为常数矩阵时,由定义可推出协差阵有如下性质:,目录 上页 下页 返回 结束,1.1.4 随机向量的数字特征,(3)设X为n维随机向量,期望和协方差存在,记 则,对于任何随机向量 来说,其协差阵都是对称阵,同时总是非负定(也称半正定)的。大多数情形下是正定的。,目录 上页 下页 返回 结束,1.1.4 随机向量的数字特征,若随机向量 的协差阵存在,且每个分量的方差大于零,则X的相关阵定义为:,rij也称为分量Xi与Xj之间的(线性)相关系数。,4、随机向量X 的相关阵,在数据处理时,为了克服由于指标的量纲不同对
7、统计分析结果带来的影响,往往在使用某种统计分析方法之前,常需将每个指标“标准化”,即做如下变换,目录 上页 下页 返回 结束,1.1.4 随机向量的数字特征,1.2 统计距离和马氏距离,目录 上页 下页 返回 结束,1.欧氏距离,2.马氏距离,1.2 统计距离和马氏距离,1.欧氏距离,在多指标统计分析中,距离的概念十分重要,样品间的不少特征都可用距离去描述。大部分多元方法是建立在简单的距离概念基础上的。即平时人们熟悉的欧氏距离,或称直线距离.如几何平面上的点P=(x1,x2)到原点O=(0,0)的欧氏距离,依勾股定理有,目录 上页 下页 返回 结束,1.2 统计距离和马氏距离,但就大部分统计问
8、题而言,欧氏距离是不能令人满意的。,目录 上页 下页 返回 结束,这里因为,每个坐标对欧氏距离的贡献是同等的。当坐标轴表示测量值时,它们往往带有大小不等的随机波动,在这种情况下,合理的办法是对坐标加权,使得变化较大的坐标比变化小的坐标有较小的权系数,这就产生了各种距离。,欧氏距离还有一个缺点,这就是当各个分量为不同性质的量时,“距离”的大小竟然与指标的单位有关。,1.2 统计距离和马氏距离,目录 上页 下页 返回 结束,例如,横轴x1代表重量(以kg为单位),纵轴x2 代表长度(以cm为单位)。有四个点A、B、C、D见图1.1,它们的坐标如图1.1所示,这时,显然AB比CD要长。,22,1.2
9、 统计距离和马氏距离,目录 上页 下页 返回 结束,现在,如果x2用mm作单位,x1单位保持不变,此时A坐标为(0,50),C坐标为(0,100),则,结果CD反而比AB长!这显然是不够合理的。,1.2 统计距离和马氏距离,目录 上页 下页 返回 结束,因此,有必要建立一种距离,这种距离要能够体现各个变量在变差大小上的不同,以及有时存在着的相关性,还要求距离与各变量所用的单位无关。看来我们选择的距离要依赖于样本方差和协方差。,因此,采用“统计距离”这个术语,以区别通常习惯用的欧氏距离。最常用的一种统计距离是印度统计学家马哈拉诺比斯(Mahalanobis)于1936年引入的距离,称为“马氏距离
10、”。,1.2 统计距离和马氏距离,目录 上页 下页 返回 结束,下面先用一个一维的例子说明欧氏距离与马氏距离在概率上的差异。,设有两个一维正态总体。若有一个样品,其值在A处,A点距离哪个总体近些呢?,图1-2,25,1.2 统计距离和马氏距离,目录 上页 下页 返回 结束,由图1-2可看出,从绝对长度来看,A点距左面总体G1近些,即A点到1比A点到2要“近一些”(这里用的是欧氏距离,比较的是A点坐标与1到2值之差的绝对值),,但从概率观点来看,A点在1右侧约41处,A点在2的左侧约32处,若以标准差的观点来衡量,A点离2比A点离1要“近一些”。,显然,后者是从概率角度上来考虑的,因而更为合理些
11、,它是用坐标差平方除以方差(或说乘以方差的倒数),从而化为无量纲数,推广到多维就要乘以协方差阵的逆矩阵-1,这就是马氏距离的概念,以后将会看到,这一距离在多元分析中起着十分重要的作用。,1.2 统计距离和马氏距离,2.马氏距离,设X、Y从均值向量为,协方差阵为的总体G中抽取的两个样品。,目录 上页 下页 返回 结束,定义X、Y两点之间的马氏距离为:,定义X与总体G的马氏距离为:,1.2 统计距离和马氏距离,设E表示一个点集,d表示距离,它EE 是到0,)的函数,可以证明,马氏距离符合如下距离的四条基本公理:,(2)当且仅当;,(3),(4),目录 上页 下页 返回 结束,1.3 多元正态分布,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高级 统计学 多元 正态分布

链接地址:https://www.31ppt.com/p-6070946.html