参数估计基础-课件.ppt
《参数估计基础-课件.ppt》由会员分享,可在线阅读,更多相关《参数估计基础-课件.ppt(89页珍藏版)》请在三一办公上搜索。
1、参数估计基础,2023/3/22,2,了解总体特征的最好方法是对总体的每一个体进行观察、试验,但这在医学研究实际中往往不可行。对无限总体不可能对所有个体逐一观察.对有限总体限于人力、财力、物力、时间或个体过多等原因,不可能也没必要对所有个体逐一研究(如对一批罐头质量检查)。借助抽样研究。,2023/3/22,3,抽样研究的目的是用样本信息推断总体特征,即用样本资料计算的统计指标推断总体参数常用的统计推断方法有参数估计(总体均数和总体概率的估计)和假设检验,2023/3/22,4,内容复习,2023/3/22,5,第五章总体均数估计,抽样分布与抽样误差分布总体均数的估计案例讨论,2023/3/2
2、2,6,复习一些概念,参数(parameter)与统计量(statistics)参数获取的途径 对总体进行研究 抽样研究抽样误差(sampling error)1.抽样误差的概念:由个体变异产生的,随机抽样引起的样本统计量与总体参数间的差异。(抽样误差=总体参数样本统计量)2.抽样误差产生的原因:3.抽样误差的特点:随机,不可避免,有规律可循。4.在大量重复抽样的情况下,可以展示其规律性,2023/3/22,7,第一节抽样分布与抽样误差,样本均数的抽样分布与抽样误差样本频率的抽样分布与抽样误差,2023/3/22,8,一、均数的抽样误差,样本均数的抽样分布 举例,总体,样本1,样本2,样本3,
3、样本,2023/3/22,9,一、均数的抽样误差,样本均数的抽样分布 抽样模拟实验 假定总体:某年某地13岁女学生身高值 XN(155.4,5.3)随机抽样:n30,K100,2023/3/22,10,一、均数的抽样误差,=155.4=5.3,实验5-1从已知的13岁女生身高总体中随机抽样示意图,2023/3/22,11,100个随机样本的样本均数(n30),2023/3/22,12,一、均数的抽样误差,2023/3/22,13,将此100个样本均数看成新变量值,则这100个样本均数构成一新分布,绘制直方图。,图3-2 从正态分布总体N(155.4,5.3)随机抽样所得样本均数分布,2023/
4、3/22,14,一、均数的抽样误差,1、样本均数的抽样分布特点各样本均数未必等于总体均数;样本均数之间存在差异;样本均数的分布规律:围绕着总体均数155.4cm,中间多,两边少,左右基本对称,服从正态分布;样本均数的变异较原变量的变异减小。,2023/3/22,15,一、均数的抽样误差,抽样误差 概念:由于抽样造成的样本统计量与统计量以及样本统计量与总体参数之间的差异叫作抽样误差。抽样误差产生的基本条件 抽样研究 个体差异表现形式 样本统计量与样本统计量之间的差异 样本统计量与总体参数之间的差异,2023/3/22,16,一、均数的抽样误差,2、均数的抽样误差(1)概念:由个体变异产生的,随机
5、抽样引起的样本均数与总体均数间的差异。(均数的抽样误差=总体均数样本均数)(2)表现形式:样本均数与总体均数间存在差异样本均数与样本均数间存在差异,2023/3/22,18,均数的抽样误差可表现为样本均数与总体均数的差值均数的抽样误差也可表现为多个样本均数间的离散程度 在实际科研中,上述二者都难以得到。,2023/3/22,19,如何度量抽样误差的大小?如何揭示抽样分布的规律?中心极限定理为我们提供解决办法:,2023/3/22,20,中心极限定理(central limit theorem)从均数为、标准差为的总体中独立随机抽样,当样本含量n增加时,样本均数的分布将趋于正态分布,此分布的均数
6、为,标准差为。,XN,N,2023/3/22,21,标准误(standard error,SE)样本统计量的标准差称为标准误,用来衡量抽样误差的大小。样本均数的标准差称为标准误。此标准误与个体变异 成正比,与样本含量n的平方根成反比。,2023/3/22,22,3、均数的标准误(standard error)(1)概念:将样本均数的标准差称为均数的标准误,它是描述均数抽样误差大小的指标(2)计算:实际工作中,往往是未知的,一般可用样本标准差s代替:,一、均数的抽样误差,2023/3/22,23,3、均数的标准误(standard error),(3)统计学意义均数的标准误越大,样本均数的分布越
7、分散,样本均数离总体均数就越远,样本均数与总体均数的差别越大,抽样误差越大;抽样误差越大,由样本均数估计总体均数的可靠性越差。反之,亦然。(4)影响抽样误差大小的因素标准差样本含量n 实际工作中,可通过适当增加样本含量来减少均数的标准误,从而降低抽样误差。,3个抽样实验结果图示,2023/3/22,25,4、总体分布非正态分布时,样本均数的分布规律中心极限定理表明,即使从非正态总体中随机抽样,只要样本含量足够大,样本均数的分布也趋于正态分布.样本均数的总体均数仍等于;样本均数的标准误仍满足均数标准误的计算式;当较小时,样本均数的分布是偏态的;当足够大(50)样本均数的分布近似正态分布,一、均数
8、的抽样误差,2023/3/22,26,非正态总体样本均数的抽样实验 图5-1(a)是一个正偏峰的分布,用电脑从中随机抽取样本含量分别为5,10,30和50的样本各1000次,计算样本均数并绘制4个直方图,2023/3/22,32,当原分布N(155.40,5.3)为正态分布时,则样本均数的分布N(155.38,1.71)也为正态分布;当原分布为偏态分布时,当样本含量足够大时,样本均数的分布也为近似正态分布。所以,不论原分布的分布类型如何,样本均数的分布均为正态分布。原分布可以用和来描述其分布特征;同样,样本均数的分布也可以用样本均数的均数和样本均数的标准差表示其分布特征。,2023/3/22,
9、33,将样本均数的标准差称为均数的标准误。标准误反映样本抽样误差的大小,是说明样本均数可靠性的一个指标,常用 的形式来表示样本均数的可 靠程度。,2023/3/22,34,影响抽样误差大小的因素有:样本标准差。S越大,也就越大。样本含量。n 越大,抽样误差越小。因此如在一定标准差条件下,加大样本含量,可减少抽样误差,以保证的样本均数的代表性和可靠性。,2023/3/22,35,例6-1 2000年某研究者随机调查某地健康成年男子27人,得到血红蛋白量的均数为125 g/L,标准差为15 g/L。试估计该样本均数的抽样误差。=,2.89g/L,2023/3/22,36,样本频率的抽样分布与抽样误
10、差,在一口袋内装有形状、重量完全相同的黑球和白球,已知黑球比例为20%(总体概率=20%),从口袋中每摸一次看清颜色后放回去,搅匀后再摸,重复摸球35次(n=35),计算摸到黑球的百分比(样本频率p i)。重复这样的实验100次,每次得到100个黑球的比例分别为14.4%,19.8%,20.2%,22.5%,等,将其频数分布列于表6-3。,2023/3/22,37,表6-3 总体概率为20%时的随机抽样结果(ni=35),2023/3/22,38,抽样分布与抽样误差,频率的抽样误差:这种样本率样本频率与样本率样本频率之间、样本率样本频率与总体率总体概率之间的差异。频率的标准误:表示频率的抽样误
11、差的指标,2023/3/22,39,样本频率 的总体均数参数为,率的标准误计算公式(5-3):公式(6-4),2023/3/22,40,例6-2 某市随机调查了50岁以上的中老年妇女776人,其中患有骨质疏松症者322人,患病率为41.5%,试估计该样本频率的抽样误差。p=41.5%=0.415,n=776,=,2023/3/22,41,思考题:什么是抽样误差?决定抽样误差大小的因素有哪些?抽样误差能避免么?抽样误差有规律么?标准误和标准差有何区别与联系?,2023/3/22,42,标准误和标准差有何区别与联系,2023/3/22,43,第二节分布,分布的概念分布的特征界值表,2023/3/2
12、2,44,一、分布的概念,2023/3/22,45,t分布,设从正态分布N(,2)中随机抽取含量为n的样本,样本均数和标准差分别为 和s,设:则t 值服从自由度为n-1的t 分布(t-distribution)。Gosset于1908年在生物统计杂志上发表该论文时用的是笔名“Student”,故t分布又称Student t分布。,2023/3/22,46,二、值与分布,学习t 分布的意义事实上,任何一个样本统计量均有其分布的特点和规律。统计量的抽样分布规律是进行统计推断的理论基础。t 分布是十分有用的,它是总体均数的区间估计和假设检验的理论基础。,2023/3/22,47,从前述实验的13岁女
13、学生身高这个正态总体中分别作样本量为 3和50的随机抽样,各抽取1000份样本,并分别得到1000个样本均数及其标准误。对它们分别作t变换,并将t值绘制相应的直方图,可得到t值分布曲线图,2023/3/22,49,三、分布的特征,分布的图形分布的参数:=n-1自由度对图形的影响分布的极限是标准正态分布分布曲线下的尾部面积(概率)界值表,2023/3/22,50,t分布,t值的分布与自由度 有关(实际是样本含量n不同)。t 分布的图形不是一条曲线,而是一簇曲线。,2023/3/22,51,t分布的特征,t分布为一簇单峰分布曲线t分布以0为中心,左右对称t 分布只有一个特征参数,即为自由度()。t
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 参数估计 基础 课件

链接地址:https://www.31ppt.com/p-3805672.html