欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    统计学课件-ch03总体均数的估计与假设检验.ppt

    • 资源ID:6440890       资源大小:478KB        全文页数:126页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    统计学课件-ch03总体均数的估计与假设检验.ppt

    课件,1,第三章 总体均数的估计与假设检验,课件,2,讲述内容:第一节 均数的抽样误差与标准误第二节 t 分布第三节 总体均数的估计第四节 t 检验第五节 假设检验的注意事项第六节 正态性检验和两样本方差比较的 F 检验,课件,3,第一节 均数的抽样误差与标准误,课件,4,统计推断:由样本信息推断总体特征。,正态(分布)总体:推断!说明!为说明抽样误差规律,先用一个实例,后引出理论。,课件,5,图3-1 1999年某市18岁男生身高N(167.7,5.32)的抽样示意图,课件,6,见P3436表3-1,课件,7,将此100个样本均数看成新变量值,则这100个样本均数构成一新分布,绘制直方图。,图3-2 从正态分布总体N(167.7,5.32)随机抽样所得样本均数分布,课件,8,,各样本均数 未必等于总体均数;各样本均数间存在差异;样本均数的分布为中间多,两边少,左右基本对称。样本均数的变异范围较之原变量的变异范围大大缩小。可算得这100个样本均数的均数为167.69cm、标准差为1.69cm。,样本均数的抽样分布具有如下特点:,课件,9,1、抽样误差:,由个体变异产生的、抽样造成的样本统计量与总体参数的差别 均数的抽样误差:由于抽样造成的样本均数与总体均数的差别 原因:1)抽样 2)个体差异,课件,10,本书以n=60为界限,课件,11,表示样本统计量抽样误差大小的统计指标。均数标准误:说明均数抽样误差的大小,总体计算公式(3-1),2、标准误(standard error,SE),实质:样本均数的标准差,课件,12,数理统计证明:,课件,13,若用样本标准差S 来估计,(3-2)降低抽样误差的途径有:通过增加样本含量n;通过设计减少S。,课件,14,第二节 t 分布(t-distribution),课件,15,一、t 分布的概念,课件,16,课件,17,式中 为自由度(degree of freedom,df),3实际工作中,由于 未知,用 代替,则 不再服从标准正态分布,而服从t 分布。,课件,18,二、t 分布的图形与特征,分布只有一个参数,即自由度,课件,19,图3-3 不同自由度下的t 分布图,课件,20,1特征:,课件,21,2 t界值表:详见附表2,可反映t分布曲线下的面积。单侧概率或单尾概率:用 表示;双侧概率或双尾概率:用 表示。,课件,22,课件,23,课件,24,第三节 总体均数的估计,课件,25,一、参数估计 用样本统计量推断总体参数。总体均数估计:用样本均数(和标准差)推断总体均数。,课件,26,课件,27,按预先给定的概率(1)所确定的包含未知总体参数的一个范围。总体均数的区间估计:按预先给定的概率(1)所确定的包含未知总体均数的一个范围。如给定=0.05,该范围称为参数的95%可信区间或置信区间;如给定=0.01,该范围称为参数的99%可信区间或置信区间。,2区间估计(interval estimation):,课件,28,二、总体均数可信区间的计算,课件,29,1.单一总体均数的可信区间,课件,30,课件,31,P25,15号样本,课件,32,课件,33,课件,34,例3-3 某地抽取正常成年人200名,测得其血清胆固醇的均数为3.64 mmol/L,标准差为1.20mmol/L,估计该地正常成年人血清胆固醇均数的95%可信区间。,课件,35,故该地正常成年人血清胆固醇均数的双侧95%可信区间为(3.47,3.81)mmolL。,课件,36,课件,37,课件,38,课件,39,例3-4 为了解氨甲喋呤(MTX)对外周血IL-2水平的影响,某医生将61名哮喘患者随机分为两组。其中对照组29例(),采用安慰剂;实验组32例(),采用小剂量氨甲喋呤(MTX)进行治疗。测得对照组治疗前IL-2的均数为20.10 IU/ml(),标准差为7.02 IU/ml();试验组治疗前IL-2的均数为16.89 IU/ml(),标准差为8.46 IU/ml()。问两组治疗前基线的IL-2总体均数相差有多大?,课件,40,第一步:,课件,41,能否下两组IL-2的总体均数“不同”或“有差别”的结论?,课件,42,三、可信区间的确切涵义,课件,43,观察p25表3-1:当1=95%时,在算得的100个可信区间中,有95个可信区间包含了总体均数,而另外5个(表3-1中第20号、31号、54号、76号和82号)不包括。,课件,44,如果能够进行重复抽样试验,平均有1(如95%)的可信区间包含了总体参数,而不是总体参数落在该范围的可能性为1。但在实际工作中,只能根据一次试验结果估计可信区间,如例3-3,95%的可信区间为3.47 3.81mmolL,就认为该区间包含了总体均数。,可信区间的确切涵义:,课件,45,一是可信度1,愈接近1愈好,如99%的可信度比95%的可信度要好;二是区间的宽度,区间愈窄愈好。当样本含量为定值时,上述两者互相矛盾。在可信度确定的情况下,增加样本含量可减小区间宽度。,可信区间估计的优劣取决于两个方面:,课件,46,四、总体均数可信区间与参考值范围的区别,课件,47,*也可用对应于双尾概率时),*也可用对应于双尾概率时),表3-2 总体均数的可信区间与参考值范围的区别,课件,48,第四节 t 检验,课件,49,1、样本均数 与已知某总体均数 比较的t检验 目的:推断一个未知总体均数 与已知总体均 数 是否有差别,用单样本设计。2、两个样本均数 与 比较的t检验目的:推断两个未知总体均数 与 是否有差 别,用成组设计。3、配对设计资料均数比较的t检验目的:推断两个未知总体均数 与 是否有差别用配对设计。,t 检验,亦称student t 检验,有下述情况:,课件,50,对于大样本,也可以近似用u检验,课件,51,t 检验的应用条件:,课件,52,假设检验过去称显著性检验。它是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。然后在H0成立的条件下计算检验统计量,最后获得P值来判断。,假设检验基本思想及步骤,课件,53,例3-5 某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L?,课件,54,假设检验的目的就是判断差别是由哪种情况造成的,单纯 抽样误差造成的抽样误差和本质差异造成的,课件,55,正常成年男性血红蛋白 140g/L,130.83g/L,男性铅作业工人血红蛋白 140g/L,一种假设H0,另一种假设H1,抽样误差,总体不同,课件,56,课件,57,H1的内容直接反映了检验单双侧。若H1中只是 0 或 0,则此检验为单侧检验。它不仅考虑有无差异,而且还考虑差异的方向。单双侧检验的确定,首先根据专业知识,其次根据所要解决的问题来确定。若从专业上看一种方法结果不可能低于或高于另一种方法结果,此时应该用单侧检验。一般认为双侧检验较保守和稳妥。,课件,58,(3)检验水准,过去称显著性水准,是预先规定的概率值,它确定了小概率事件的标准。在实际工作中常取=0.05。可根据不同研究目的给予不同设置。,课件,59,课件,60,课件,61,图3-5 例3-5中P值示意图,课件,62,课件,63,若,是否也能下“无差别”或“相等”的结论?,课件,64,一、单样本 t 检验(one sample/group t-test),即样本均数(代表未知总体均数)与已知总体均数0(一般为理论值、标准值或经过大量观察所得稳定值等)的比较。其检验统计量按下式计算,课件,65,例3-5 某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L?(1)建立检验假设,确定检验水准H0:=0=140g/L,即铅作业男性工人平均血红 蛋白含量与正常成年男性平均值相等H1:0=140g/L,即铅作业男性工人平均血红 蛋白含量与正常成年男性平均值不等=0.05,课件,66,(2)计算检验统计量,课件,67,(3)确定P值,作出推断结论,课件,68,配对t 检验适用于配对设计的计量资料。配对设计类型:两同质受试对象分别接受两种不同的处理;同一受试对象分别接受两种不同处理;同一受试对象(一种)处理前后。,二、配对t 检验(paired/matched t-test),课件,69,例3-6 为比较两种方法对乳酸饮料中脂肪含量测定结果是否不同,某人随机抽取了10份乳酸饮料制品,分别用脂肪酸水解法和哥特里罗紫法测定其结果如表3-3第(1)(3)栏。问两法测定结果是否不同?,课件,70,表3-3 两种方法对乳酸饮料中脂肪含量的测定结果(%),课件,71,(1)建立检验假设,确定检验水准H0:d0,即两种方法的测定结果相同H1:d0,即两种方法的测定结果不同=0.05(2)计算检验统计量本例n=10,d=2.724,d2=0.8483,,课件,72,按公式(3-16)(3)确定P值,作出推断结论 查附表2的t界值表得P0.001。按=0.05水准,拒绝H0,接受H1,有统计学意义。可认为两种方法对脂肪含量的测定结果不同,哥特里罗紫法测定结果较高。,课件,73,三、两样本t检验(two-sample/group t-test),又称成组 t 检验,适用于完全随机设计两样本均数的比较,此时人们关心的是两样本均数所代表的两总体均数是否不等。两组完全随机设计是将受试对象完全随机分配到两个不同处理组。,课件,74,适用范围:完全随机设计两样本均数的比较检验方法:依两总体方差是否齐性而定。,课件,75,课件,76,例3-7 为研究国产四类新药阿卡波糖胶囊的降血糖效果,某医院用40名II型糖尿病病人进行同期随机对照试验。试验者将这些病人随机等分到试验组(用阿卡波糖胶囊)和对照组(用拜唐苹胶囊),分别测得试验开始前和8周后的空腹血糖,算得空腹血糖下降值见表3-4,能否认为该国产四类新药阿卡波糖胶囊与拜唐苹胶囊对空腹血糖的降糖效果不同?,课件,77,课件,78,(2)计算检验统计量,课件,79,(3)确定P值,作出推断结论,课件,80,若变量变换后总体方差齐性 可采用t 检验(如两样本几何均数的t 检验,就是将原始数据取对数后进行t 检验);若变量变换后总体方差仍然不齐 可采用t 检验或Wilcoxon秩和检验。,若两总体方差不等(),?,课件,81,2.Cochran&Cox近似t 检验(t 检验),课件,82,课件,83,例3-8 在上述例3-7国产四类新药阿卡波糖胶囊的降血糖效果研究中,测得用拜唐苹胶囊的对照组20例病人和用阿卡波糖胶囊的试验组20例病人,其8周时糖化血红蛋白HbA1c(%)下降值如表3-5。问用两种不同药物的病人其HbA1c下降值是否不同?,课件,84,表3-5 对照组和试验组HbA1c下降值(%),对照组方差是试验组方差的3.77倍,经方差齐性检验,认为两组的总体方差不等,故采用近似 t 检验。,课件,85,(1)建立检验假设,确定检验水准(略),(2)计算检验统计量,课件,86,(3)确定P值,作出推断结论。查t界值表t0.05/2,19=2.093。,由t=0.9650.05。按=0.05水准,不拒绝H0,无统计学意义。还不能认为用两种不同药物的病人其HbA1c下降值不同。,课件,87,3.Satterthwaite近似t检验:Cochran&Cox法是对临界值校正 而Satterthwaite法则是对自由度校正。,课件,88,以=28.428、t=0.965查附表2的t界值表得0.20P0.40。结论同前。,按Satterthwaite法对例3-8做检验,得,课件,89,3.Welch法近似t检验 Welch法也是对自由度进行校正。校正公式为,课件,90,对例3-8,如按Welch法,则,以=29.429、t=0.965查附表2的t界值表得0.20P0.40。结论同前。,课件,91,第五节 假设检验注意事项,课件,92,一、I型错误和II型错误,假设检验是利用小概率反证法思想,根据P值判断结果,此推断结论具有概率性,因而无论拒绝还是不拒绝H0,都可能犯错误。见表3-8。,课件,93,表3-8 可能发生的两类错误,课件,94,I 型错误:“实际无差别,但下了有差别的结论”,假阳性错误。犯这种错误的概率是(其值等于检验水准)II型错误:“实际有差别,但下了不拒绝H0的结论”,假阴性错误。犯这种错误的概率是(其值未知)。但 n 一定时,增大,则减少。1-:检验效能(power):当两总体确有差别,按检验水准 所能发现这种差别的能力。,课件,95,图3-6 I型错误与II型错误示意图(以单侧u检验为例),课件,96,减少I型错误的主要方法:假设检验时设定 值。,减少II型错误的主要方法:提高检验效能。,提高检验效能的最有效方法:增加样本量。,如何选择合适的样本量:实验设计。,课件,97,三、假设检验应注意的问题,1.要有严密的研究设计,尤其是下因果结论。2.不同的资料应选用不同检验方法。3.正确理解“显著性”一词的含义(用统计学意义一词替代)。,课件,98,4.结论不能绝对化,提倡使用精确P值。5.注意统计“显著性”与医学/临床/生物 学“显著性”的区别,课件,99,6.可信区间与假设检验各自不同的作用,要结合使用。,一方面,可信区间亦可回答假设检验的问题,算得的可信区间若包含了H0,则按水准,不拒绝H0;若不包含H0,则按水准,拒绝H0,接受H1。,课件,100,另一方面,可信区间不但能回答差别有无统计学意义,而且还能比假设检验提供更多的信息,即提示差别有无实际的专业意义。,课件,101,图3-7 可信区间在统计推断上提供的信息,课件,102,虽然可信区间亦可回答假设检验的问题,并能提供更多的信息,但并不意味着可信区间能够完全代替假设检验。可信区间只能在预先规定的概率 检验水准的前提下进行计算,而假设检验能够获得一较为确切的概率P值。,课件,103,第六节,正态性检验和两样本方差比较的F检验,课件,104,t 检验的应用条件是正态总体且方差齐性;配对t 检验则要求每对数据差值的总体为正态总体。进行两小样本t检验时,一般应对资料进行方差齐性检验,尤其两样本方差悬殊时。若方差齐,采用一般的t 检验;若方差不齐,则采用t检验。,课件,105,一、正态性检验(normality test),1图示法:P-P plot,Q-Q plot 2矩法 偏度系数(skewness),峰度系数(kurtosis)。3 W 检验法 4 D 检验法,课件,106,图3-8 例3-1中100个样本均数的P-P图,课件,107,图3-9 例3-1中100个样本均数的Q-Q图,课件,108,课件,109,课件,110,例3-9 试用矩法对表3-1中计算机模拟抽样所得100个样本均数进行正态性检验。,课件,111,(2)计算检验统计量,课件,112,二、两样本方差比较的F检验 两小样本t 检验时,检查两样本方差代表的总体方差是否相等(决定t 检验的方法)。,1.Levene检验 2.F检验,课件,113,课件,114,课件,115,图3-10 不同自由度时F分布的图形,课件,116,(2)计算检验统计量,例3-10 对例3-7,用F 检验判断两总体空腹血糖下降值的方差是否不等。,(1)建立检验假设,确定检验水准,课件,117,(3)确定P值,作出推断结论,课件,118,三、变量变换,常用的变量变换有对数变换、平方根变换、倒数变换、平方根反正弦变换等,应根据资料性质选择适当的变量变换方法。,课件,119,课件,120,课件,121,课件,122,小结,1.均数的标准误与标准差的区别,2.两均数差别检验的比较:,大样本也可近似用u检验,课件,124,3.假设检验的步骤及有关概念,(1)基本思想:“小概率事件在一次抽样试验中几乎是不可能发生”的原理。(2)步骤:三部曲(3)类错误、类错误(4)检验效能(1-),课件,125,练习题一最佳选则题全做三计算分析题,,课件,126,谢谢大家!,

    注意事项

    本文(统计学课件-ch03总体均数的估计与假设检验.ppt)为本站会员(小飞机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开