抽样分布及总体平均数的推断.ppt
《抽样分布及总体平均数的推断.ppt》由会员分享,可在线阅读,更多相关《抽样分布及总体平均数的推断.ppt(69页珍藏版)》请在三一办公上搜索。
1、第六章,抽样分布及总体平均数的推断,第一节 抽样分布,区分三种不同性质的分布:总体分布:总体内个体数值的频数分布样本分布:样本内个体数值的频数分布抽样分布:某一种统计量的概率分布,一、抽样分布的概念,抽样分布是从同一总体内抽取的不同样本的统计量的概率分布。抽样分布是一个理论的概率分布,是统计推断的依据。,二、平均数抽样分布的几个定理,从总体中随机抽出容量为n的一切可能样本的平均数之平均数等于总体的平均数。,容量为n的平均数在抽样分布上的标准差(即平均数的标准误),等于总体标准差除以n的平方根。,(81),(82),从正态总体中,随机抽取的容量为n的一切可能样本平均数的分布也呈正态分布。虽然总体
2、不呈正态分布,如果样本容量较大,反映总体和的样本平均数的抽样分布,也接近于正态分布。,三、标准误及其计算,某种统计量在抽样分布上的标准差,称为标准误。标准误用来衡量抽样误差。标准误越小,表明样本统计量与总体参数的值越接近,样本对总体越有代表性,用样本统计量推断总体参数的可靠度越大。因此,标准误是统计推断可靠性的指标。,平均数标准误的计算,(1)总体正态,已知(不管样本容量大小),或总体非正态,已知,大样本平均数的标准误为:,平均数标准误的计算,(2)总体正态,未知(不管样本容量大小),或总体非正态,未知,大样本平均数标准误的估计值为,(8),四、平均数离差统计量的分布,由样本的平均数对总体平均
3、数进行估计,首先要了解平均数离差统计量的分布,才能根据一定的概率,由样本的平均数对总体的平均数做出估计。,1.总体正态,已知(不管样本容量大小),或总体非正态,已知,大样本,平均数离差的的抽样分布呈正态分布,(84),2.总体正态,未知(不管样本容量大小),或总体非正态,未知,大样本,平均数离差的的抽样分布呈t分布,(85),t分布的特点,形状与正态分布曲线相似t分布曲线随自由度不同而有一簇曲线自由度的计算:,自由度是指能够独立变化的数据个数。,查t分布表时,需根据自由度及相应的显著性水平,并要注意是单侧数据还是双侧。,3.总体未知,大样本时的近似处理,样本容量增大后,平均数的抽样分布接近于正
4、态分布,可用正态分布近似处理:,(86),第二节 总体平均数的估计,一、总体参数估计的基本原理,根据样本统计量对相应总体参数所作的估计叫作总体参数估计。总体参数估计分为点估计和区间估计。由样本的标准差估计总体的标准差即为点估计;而由样本的平均数估计总体平均数的取值范围则为区间估计。,1.点估计,良好的点估计量应具备的条件:无偏性 如果一切可能个样本统计量的值与总体参数值偏差的平均值为0,这种统计量就是总体参数的无偏估计量。有效性 当总体参数不止有一种无偏估计量时,某一种估计量的一切可能样本值的方差小者为有效性高,方差大者为有效性低。,一致性当样本容量无限增大时,估计量的值能越来越接近它所估计的
5、总体参数值,这种估计是总体参数一致性估计量。充分性一个容量为n的样本统计量,应能充分地反映全部n个数据所反映的总体的信息。,2.区间估计,以样本统计量的抽样分布(概率分布)为理论依据,按一定概率的要求,由样本统计量的值估计总体参数值的所在范围,称为总体参数的区间估计。对总体参数值进行区间估计,就是要在一定可靠度上求出总体参数的置信区间的上下限。,二总体平均数的区间估计,1总体平均数区间估计的基本步骤根据样本的数据,计算样本的平均数和标准差;计算平均数抽样分布的标准误;确定置信概率或显著性水平;根据样本平均数的抽样分布确定查何种统计表;计算置信区间;解释总体平均数的置信区间。,2平均数区间估计的
6、计算,总体正态,已知(不管样本容量大小),或总体非正态,已知,大样本平均数离差的的抽样分布呈正态,平均数的置信区间为:,(91),例题1:某小学10岁全体女童身高历年来标准差为6.25厘米,现从该校随机抽27名10岁女童,测得平均身高为134.2厘米,试估计该校10岁全体女童平均身高的95和99置信区间。,解:10岁女童的身高假定是从正态总体中抽出的随机样本,并已知总体标准差为=6.25。无论样本容量大小,一切样本平均数的标准分数呈正态分布。于是可用正态分布来估计该校10岁女童身高总体平均数95和99的置信区间。,其标准误为,当0.95时,1.96因此,该校10岁女童平均身高95的置信区间为:
7、,当0.99时,2.58因此,该校10岁女童平均身高99的置信区间为:,总体正态,未知(不管样本容量大小),或总体非正态,未知,大样本,平均数离差的抽样分布为t分布,平均数的置信区间为:,(92),例题2:从某小学三年级随机抽取12名学生,其阅读能力得分为28,32,36,22,34,30,33,25,31,33,29,26。试估计该校三年级学生阅读能力总体平均数95和99的置信区间。,解:12名学生阅读能力的得分假定是从正态总体中抽出的随机样本,而总体标准差未知,样本的容量较小(=1230),在此条件下,样本平均数与总体平均数离差统计量服从呈t分布。于是需用t分布来估计该校三年级学生阅读能力
8、总体平均数95和99的置信区间。,由原始数据计算出样本统计量为,当0.95时,,因此,该校三年级学生阅读能力得分95的置信区间为:,当0.99时,,因此,该校三年级学生阅读能力得分99的置信区间为:,总体正态,未知,大样本,平均数的抽样分布接近于正态分布,用正态分布代替t分布近似处理:,(93),例题3:从某年高考中随机抽取102份作文试卷,算得平均分数为26,标准差为1.5,试估计全部考生作文成绩95和99的置信区间。,解:学生高考分数假定是从正态总体中抽出的随机样本,而总体的标准差未知,样本平均数与总体平均数离差统计量呈t分布。但是由于样本容量较大(n=12030),t分布接近于正态分布,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样 分布 总体 平均数 推断
链接地址:https://www.31ppt.com/p-6164172.html