《极限定理和抽样分布.ppt》由会员分享,可在线阅读,更多相关《极限定理和抽样分布.ppt(27页珍藏版)》请在三一办公上搜索。
1、第七章极限定理和抽样分布,切贝谢夫定理:Chebyshevs Theorem,如果k2,则至少有75的个案分布在2倍的标准差之内;如果k3,则至少有89但个案分布在3倍的标准差之内。,切贝谢夫不等式,我们知道一个分布的特征值(如均值和方差)去推算这个分布的情况,当不知道总体分布而只知道总体特征值的时候,对概率分布做最保守的估计。注意:(1)这是保守的估计,因为不知道总体的分布;(2)由于这里指的是绝对离差,所以我们难以推知一端数据的概率,除非我们知道这个分布是对称分布。,极限定理:研究观察次数趋向无限次时,随机事件的变化方式。分类:1 大数定理:在什么条件下,随机事件可以转化为不可能事件或必然
2、事件。(特征值)(Law of Large Numbers)2 中心极限定理:在什么条件下,随机变量之和的分布可以近似为正态分布。(Central Limit Theory),一、贝努里大数定理(N变大时,诸随机变量的均值逐步接近总体的均值),样本成数,实际上是指的样本频率。在讲离散型随机变量的概率分布时,我们将随机变量X定义为“A类事件出现的次数”。我们将出现的实际次数(m)除以总试验次数(n),得到的A类实际出现的频率,我们叫做样本成数:,这是一个已知的、固定的值。,样本均值,是指将每一次独立试验的X的实际取值取平均数,得到的是样本均值:,在趋于极限时,离散变量的特征值行为:频率值趋近于概
3、率值,或者说样本成数无限趋近于总体成数。(可以看作n次独立实验,就有n个独立同分布的随机变量,每一个都是二点分布,数学期望p方差pq),二、切贝谢夫大数定理(N变大时,诸随机变量的均值逐步接近总体的均值),在趋于极限时,连续变量的特征值行为:平均值趋近于数学期望,或者说样本均值无限趋近于总体均值。,三、中心极限定理,几种等效的公式:,抽样分布,1 总体分布 population distributionX的所有取值形成的分布。我们在分析中往往不能知道总体分布的情况。2 样本分布 Sample distribution 3 抽样分布,理解抽样分布,(1)设想我们从一个总体中抽取一个样本容量为n的
4、样本;(2)抽取之后我们得到了样本;(3)我们现在把这个样本均值也看作是一个随机变量(它的确是个随机变量);(4)样本均值的概率分布就是当我们重复不断抽取n个样本时,我们得到的不同的样本均值出现的可能性是不同的,也就是说它会有一个概率分布。我们把这个分布叫做样本均值的抽样分布;(5)当样本容量增大时,无论总体是什么分布,根据中心极限定理,样本均值的抽样分布是一个正态分布。,样本均值的数学期望就是总体的均值,而它的方差是总体方差的1/n。,样本均值的抽样分布(连续型变量),样本均值是什么形式,与两个因素有关系:(1)总体分布(2)样本容量,当n=50时,不论总体分布如何,样本均值均服从正态分布。
5、,(这里也可以写出均值的均值),(注意这里用S表示样本的标准差),样本方差在样本容量逐渐增大时和总体方差一样了。是以总体为期望值的。,则当n很大时,t分布的方差为1,接近标准正态分布。,为了查表方便,n30时,当成正态分布,当总体为有限总体时且不放回抽样时,n=50样本的均值服从正态分布,这里需要方差已知,校正系数,当总体为有限正态总体时且不放回抽样时,n50样本的均值服从正态分布,必须是方差已知,总结样本均值的抽样分布:,抽样误差/标准误,样本方差的抽样分布,统计证明,当总体分布为正态分布时,则比值:,当n变大时,卡方分布变成正态分布。,当n逐渐增大时,我们将随机变量X看作是n个独立同分布的二点分布中事件A出现的次数,这样X实际上是n个二点随机变量之和。根据中心极限定理,XN(np,npq),样本成数的抽样分布,二项分布的极限行为:,在这里,我们讨论在何种情况下,二项分布会趋近于正态分布呢?取决于两个条件:1、二项分布的偏度 p(总体分布)2、样本容量 n,P的取值为什么很重要?,因为p还涉及到总体分布的方差。总体分布方差越大,就要求n越大才会形成正态分布,若p取值偏小,则虽然n比较大,以正态分布模拟二项分布误差太大:,按二项分布计算,按样本成数计算,若x B(10,0.5),若n变大,n=30,例如 n=100,p=0.1,对二项分布的总结:,
链接地址:https://www.31ppt.com/p-6227591.html