计量资料的统计推断课件.ppt
《计量资料的统计推断课件.ppt》由会员分享,可在线阅读,更多相关《计量资料的统计推断课件.ppt(100页珍藏版)》请在三一办公上搜索。
1、2022/12/10,第四章与第五章 统计推断,1,医学统计学第四章与第五章计量资料的统计推断,2022/12/10,第四章与第五章 统计推断,2,医学统计学计量资料的统计推断,第四章第一节 抽样误差与标准误差第二节 总体均数的估计第三节 假设检验意义和步骤第五章第一节第五节 t检验第六节 t检验中的注意事项 第七节 假设检验中两类错误,2022/12/10,第四章与第五章 统计推断,3,第四章第一节均数的抽样误差与标准误,统计推断与抽样误差均数的抽样误差标准误SE应用及减少的途径,2022/12/10,第四章与第五章 统计推断,4,1 总体与样本,一 标准误,2022/12/10,第四章与第
2、五章 统计推断,5,2 统计推断,statistical inference为了研究总体进行随机抽样获取样本,利用样本信息推断总体特征的过程。医学研究中大多数是无限总体,即使是有限总体,但也经常受各种条件的限制,不可能直接获得总体的信息。内容:参数估计与假设检验。,一 标准误,2022/12/10,第四章与第五章 统计推断,6,3 抽样误差(参阅P6),sampling error。在抽样研究(sampling study)中,由于生物个体的差异客观存在,造成的样本统计量与总体参数之间的差异,或同一总体的样本统计量之间的差异。在抽样研究中,抽样误差是无法避免的,但具有一定的规律性。产生抽样误差
3、的原因:个体差异。样本均数的抽样误差是指样本均数与总体均数之间的差异,或样本均数之间的差异。,一 标准误,2022/12/10,第四章与第五章 统计推断,7,4 样本均数的标准差,统计学中把样本均数的标准差用于描述样本均数的离散程度,称为标准误(standard error)。用于衡量描述抽样误差的大小。样本均数标准误越小,说明样本均数与总体均数的差异程度越小,用该样本均数估计总体均数越可靠。越大,样本均数的抽样误差就越大。,一 标准误,2022/12/10,第四章与第五章 统计推断,8,5 标准误SE,一 标准误,2022/12/10,第四章与第五章 统计推断,9,6 SE的应用及减少的途径
4、,抽样误差的大小,样本均数变异度,说明样本均数估计总体均数的可靠性;SD与SE都是说明变异程度的大小。SD表示样本观察值变异度,说明Mean对观察值的代表程度。用于估计总体均数的可信区间;用于假设检验。减少SE的途径克服系统误差和减少随机误差;增大样本含量。,一 标准误,2022/12/10,第四章与第五章 统计推断,10,7 标准差SD与标准误SE的区别,一 标准误,2022/12/10,第四章与第五章 统计推断,11,第四章 第二节总体均数的估计,t 分布 t-distribution总体均数的估计Estimation of Population Mean参数估计可信区间的涵义与要素总体均
5、数的可信区间,2022/12/10,第四章与第五章 统计推断,12,1 t分布的推导(P29),均数估计,2022/12/10,第四章与第五章 统计推断,13,2 t分布的曲线与特征(P29),均数估计,2022/12/10,第四章与第五章 统计推断,14,3 附表2 t分布界值表 P195,横标目:自由度n;纵标目:概率P。t界值是在某一自由度下,t分布曲线下两端(双侧)阴影部分为P。反映t分布曲线下的面积。从概率的角度看:阴影部分是P=P( t=| ta(n)|)。,均数估计,2022/12/10,第四章与第五章 统计推断,15,4 查 t界值表,单侧:n=20, a =0.05,ta(n
6、)=1.725低侧:P(t-1.725)=1a =0.95高侧:P(t=1.725)=a=0.05 或P(t= 2.086)=a=0.05,或P(|t|2.086)=1-a =0.95,均数估计,2022/12/10,第四章与第五章 统计推断,16,5 参数估计 parametric estimation,由样本统计量估计总体参数。点(值)估计,point estimation。求导总体参数的估计值。区间估计,interval estimation。把抽样误差考虑在内的总体指标的估计方法。按预先给定的概率(可信度、confidence level)估计未知总体参数的可能范围。1a:可信度,置信
7、率;a为冒险率。置信区间, confidence interval,CI可信区间是以一定置信率进行估计得到的区间。,均数估计,2022/12/10,第四章与第五章 统计推断,17,6 可信区间CI的涵义,平均有100(1- )个CI包含总体均数,有100个CI不包含(估计错误)。有1- (如95%)的可能认为计算出的可信区间包含了总体参数。95%可信区间:按95%的可信度估计的总体参数的所在范围。95%参考值范围:同质总体内95%个体值的估计范围。可信区间,confidence interval,CI;可信限,confidence limit,CL。,均数估计,2022/12/10,第四章与第
8、五章 统计推断,18,7 可信区间CI要素,准确度accuracy:反映在可信度的大小。可信区间包容总体均数的概率大小,愈接近1愈好。99%的可信区间比95%的可信区间要好。精密度precision:反映在区间的长度。区间的跨度,跨度越小,精确度越高。95%的可信区间比99%的可信区间要好 。在可信度确定的前提下,增加样本例数,可减少区间宽度。,均数估计,2022/12/10,第四章与第五章 统计推断,19,8 总体均数的可信区间(s未知),均数估计,2022/12/10,第四章与第五章 统计推断,20,9 例4.2 小样本,某医生测得25名动脉粥样硬化患者血浆纤维蛋白原含量的均数为3.32
9、g/L,标准差为0.57 g/L。该种病人血浆纤维蛋白原含量总体均数的95%可信区间为3.093.56 g/L 。=25-1= 24,t0.05/2(24) =2.064,均数估计,2022/12/10,第四章与第五章 统计推断,21,10 例4.3 大样本,试计算例4.1中该地成年男子红细胞总体均数的95%可信区间。该地正常人血清胆固醇均数95%的可信区间为4.714.83(1012/L)。,均数估计,2022/12/10,第四章与第五章 统计推断,22,利用One-Sample T Test过程。计算该地成年男子红细胞数均数的95%CI。建立数据文件,x:4.76,5.26,4.76。An
10、alyzeCompare MeansOne-Sample T Test.。test variable(s):x。test value:0,默认值。单击OK运行。得该地成年男子红细胞数均数的95%CI为4.714(1012/L)4.837(1012/L)。,11 SPSS计算CI之一:例2.1,P9,均数估计,2022/12/10,第四章与第五章 统计推断,23,11 SPSS计算CI之一:例2.1,P8,均数估计,2022/12/10,第四章与第五章 统计推断,24,11 SPSS计算CI之一:例2.1,P8,均数估计,2022/12/10,第四章与第五章 统计推断,25,11 SPSS计算C
11、I之一:例2.1,P8,均数估计,95% Confidence Interval of the Difference差值95%的可信区间(4.7141,4.8372)差值=mean(样本均数) - Test Value =4.775 0 = 4.775,2022/12/10,第四章与第五章 统计推断,26,利用Explore过程。计算该地成年男子红细胞数均数的95%CI。建立数据文件,x:4.76,5.26,4.76。AnalyzeDescriptive StatisticsExplore. 。Dependent List:x;单击OK运行。默认的可信度为0.95,可单击Statistics按
12、钮更改。得该地成年男子红细胞数均数的95%CI为4.714(1012/L)4.837(1012/L)。,12 SPSS计算CI之二:例2.1(P8),均数估计,2022/12/10,第四章与第五章 统计推断,27,12 SPSS计算CI之二:例2.1(P9),均数估计,2022/12/10,第四章与第五章 统计推断,28,12 SPSS计算CI之二:例2.1(P8),均数估计,单击,均数的可信区间:95%,单击,2022/12/10,第四章与第五章 统计推断,29,12 SPSS计算CI之二:例2.1(P8),均数估计,2022/12/10,第四章与第五章 统计推断,30,13 可信区间CI的
13、拟合,均数估计,在SPSS的Syntax Editor(语法编辑)窗口,输入以下程序,并Run(运行)。,2022/12/10,第四章与第五章 统计推断,31,13 可信区间CI的拟合,均数估计,从N(2,1)总体中抽取了1000个样本,样本含量均为10。经计算,有948个样本的CI包含2(总体均数),52个不含2。,2022/12/10,第四章与第五章 统计推断,32,13 可信区间CI的拟合,均数估计,从N(2,1)总体中抽取1000个样本均数的均数为2.0070,标准差为0.30978。标准误(理论值)为1/10=0.3162。,2022/12/10,第四章与第五章 统计推断,33,13
14、 可信区间CI的拟合,均数估计,由1000个样本均数为数据,制作的直方图。,2022/12/10,第四章与第五章 统计推断,34,14 可信区间与参考值范围的区别,均数估计,2022/12/10,第四章与第五章 统计推断,35,第四章第三节假设检验的意义和步骤,假设检验的基本概念例4.4一般步骤小概率事件,2022/12/10,第四章与第五章 统计推断,36,1 假设检验的基本概念,假设检验,hypothesis testing应用统计原理对所得的差异建立假设,并利用样本信息对假设作出拒绝或不拒绝的判断的统计方法。参数检验:对总体参数作出假设的假设检验。非参数检验:对未知总体的分布作出假设的假
15、设检验。,三假设检验,2022/12/10,第四章与第五章 统计推断,37,2 例4.4,使用黑加仑油软胶囊治疗高脂血症,30名高脂血症患者治疗前后血清甘油三酯检测结果的差值为1.380.76 (g/L),问治疗后血清甘油三酯是否有所改善?判断是否 m m0 。m=m0,差异仅由抽样误差所造成。mm0,两总体不一样。,m0=0已知总体,m未知总体,样本,样本均数=1.38标准差=0.76,抽样,代表?,三假设检验,2022/12/10,第四章与第五章 统计推断,38,3.1 建立检验假设,根据统计推断的目的,对总体特征(参数或分布)提出的假设。检验假设,hypothesis under tes
16、t无效假设、零假设,null hypothesisH0:假设所比较的样本来自同一总体。H0:m=m0=0。备择假设,alternative hypothesisH1:假设所比较的样本来自不同总体。H1:mm0=0,或mm0=0,或mm0=0 。单、双侧的确定:以双侧检验较为稳妥,尤其是多样本时,预实验亦多用双侧检验。,三假设检验,2022/12/10,第四章与第五章 统计推断,39,3.2 确定检验水准,size of a test,预先规定的概率值。确定H0成立但被拒绝的概率的界值。预先确定的;允许犯错误机率。=P(| t |ta)=P(t-ta或tta)。较小:有利于提高“阳性”统计检验结
17、果的可靠性;较大:有利于发现研究总体可能存在的差异,可靠性降低。在实际工作中,常取=0.05。,三假设检验,2022/12/10,第四章与第五章 统计推断,40,3.3 选定检验方法和检验统计量,在H0为真的前提下,根据不同的资料和不同的分析目的,选择适当的检验方法。不同检验方法各有其相应的检验统计量及计算公式。统计量是用于抉择是否拒绝H0。统计量的分布在统计推断中至关重要。,三假设检验,2022/12/10,第四章与第五章 统计推断,41,3.4 确定P值,P值:由H0所规定的总体中作随机抽样而获得=或=现有统计量的概率。双侧:P=P(|t|9.945。单侧:P=P(| t |9.945),
18、或P=P(t-9.945);本例:n=30-1=29,查附表2(P195)。双侧:P0.01,单侧:P0.005。,三假设检验,2022/12/10,第四章与第五章 统计推断,42,3.5 做出统计推断,当P时,拒绝H0,接受H1,差异有统计学意义;当P时,不拒绝H0,差异无统计学意义。本例:P0.05= ,表明差异无统计学意义。或t=9.945 ,。统计推断:统计结论与专业结论。应将两者有机地结合,作出相应的结论。注意:与P的区别。图形为tt(a,n),Pa时的情形。,三假设检验,2022/12/10,第四章与第五章 统计推断,43,3 一般步骤,建立假设和确定检验水准(size of a
19、test):含单、双侧的确定;以上各项应在设计中确定。选定检验方法和计算检验统计量;确定P值和做出统计推断。,三假设检验,2022/12/10,第四章与第五章 统计推断,44,4.1 小概率事件,拒绝或接受H0是以小概率原理为准则。一次实验中,已知某事件发生的概率很小,则认为这事件在一次实验中实际上是不可能事件;其对立事件实际上是必然事件。若a=0.05:100次实验中该事件发生5次。可认为做一次实验时,该事件几乎是不发生的。在某种假设成立下,若某事件为小概率事件,但它在一次实验中发生了,则认为所作的假设不合理,从而拒绝先前的假设。,三假设检验,2022/12/10,第四章与第五章 统计推断,
20、45,4.2 有差别与无差别,若P时,按所取检验水准,拒绝H0,接受H1,下“有差别”的结论。若P,不能下“无差别”或“相等”的结论。正确的说法是按所取检验水准 ,接受H1的统计证据不足。在H1成立的条件下,如果试验样本含量少,也同样可以得到P的检验结果。假设检验不能提供相信“无差别”结论正确的概率保证。,三假设检验,2022/12/10,第四章与第五章 统计推断,46,第五章第二节第五节 t检验,应用条件单个样本t检验配对样本t检验两独立样本t检验t检验中的注意事项,2022/12/10,第四章与第五章 统计推断,47,1 t检验的应用条件,t检验:计量资料、两均数差别的假设检验。应用条件只
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计量 资料 统计 推断 课件

链接地址:https://www.31ppt.com/p-1596276.html