统计学课件.ppt
《统计学课件.ppt》由会员分享,可在线阅读,更多相关《统计学课件.ppt(152页珍藏版)》请在三一办公上搜索。
1、Aspirin出品,此课件是我当年上完统计课以后考试前精心整理制作的。对课本上的内容进行了条理化和系统化,使之一目了然、层层展开,有利于同学们从整体上理解和把握统计学的方法和步骤。 此课件的制作是一项费时费力的工作,尤其是其中大量公式的录入比较繁琐。但我乐在其中,因为收获远远大于付出。因此我将它和大家分享,如果它能对你的统计学成绩的提高有所帮助,我将感到莫大的欣慰,也算是我做为一名老山医人送给学弟学妹们的一份小礼物吧! 另外,对于本课件的不足之处或者大家有更好的想法,欢迎大家对它进行进一步的修整,使之更加丰富和完善。,2008年11月22日,统计工作的基本步骤和方法,1.设计4.分析资料,医学
2、参考值的范围总体均数的估计总体率的估计总体平均数的估计,参数检验非参数检验(秩和检验),统计描述统计推断,参数估计假设检验(原理注意事项),点值估计区间估计,样本内部样本之间,直线相关直线回归,(区别与联系),调查设计实验设计,复杂和特殊资料的分析方法,协方差分析多元线性回归分析Logistic回归分析生存分析,不考虑交互作用:完全随机设计、配对设计与配伍组设计、 交叉设计、拉丁方设计考虑交互作用:析因实验设计、正交实验设计、均匀实验设计,(概述),2.搜集资料,3.整理资料,第二章 统计描述,数值变量资料集中趋势:均数,几何均数,中位数离散趋势:全距,四分位数间距,方差,标准差,变异系数(C
3、V)中位数计算:N为奇数时: X(N+1)/2N为偶数时(XN/2+XN/2+1)/2M=L+(N50%-fL)i/fM,双侧1s:68.27%1.96s:95%2.58s:99%单侧1.645s:95%2.326s:99%,计算相对数时的注意事项,分母不宜过小不能以构成比代替率观察单位数不等的几个率不能直接相加求其平均率比较相对数时应注意其可比性对样本率的比较应遵循随机抽样,并做假设检验,标准化法,目的:消除混杂因素的影响基本思想:将所比较的两组或多组资料的构成按统一的”标准”调整后,计算标化率,使其具有可比性,统计表,由标题,标目,线条,数字构成横标目位于表的左侧,通常为被研究的事物;纵标
4、目位于表的上端,为说明横标目的统计指标.线条:只保留顶线,底线,纵标目下线和合计上线,顶线与底线应略粗,表的左上角不宜用斜线.数字:用阿拉伯数字.同一指标的小数位数要一致并对齐;数字暂缺和无数字者分别以“”和“”表示,数字为“”者不应空项,统计图,制图的基本要求:标题列于图的下方除圆图外,图形长宽比例一般为:左右图例一般位于右上角,但不宜过多常用统计图条图:纵轴尺度必须从开始,一般要等距直条的宽度和间隔要一致一般按自然顺序排列,无自然顺序则按直条的高低顺序排列,圆图:由点开始,由大到小按顺时针方向排列,其它置最后线图:表示连续性资料在时间上的变化,或随另一现象而变动的情况直方图:表示连续性资料
5、的频数分布散点图,第三章抽样分布与参数估计,二项分布(p34),概率函数:均数和标准差:,图形特点:当.时,图形呈对称分布当.时,图形呈偏态分布;越远离0.5,其分布越偏,偏着n的增大,其分布逐渐趋于对称,Poisson分布,离散型分布研究单位时间、人群、空间内,某罕见事件发生次数的分布概率函数:应用条件:除时,图形近似正态分布;50时,图形为正态分布,第四章数值变量资料的假设检验,假设检验的原理,根据正态分布原理,当从正态分布总体中以固定随机抽样时,理论上,应该有的u 1.96;若进行一次抽样时, u 1.96的可能为5%。假设,在一次抽样研究中得出u 1.96,则p0.05,此为小概率事件
6、。依据“小概率事件在一次随机试验中认为不可能发生”的定理,可认为此样本不是来自该总体。,t检验,适用范围样本均数与总体均数的比较(未知且n50或n30)成组设计的两小样本均数的比较(n,n均小于30或50)配对设计的两样本均数的比较应用条件:当样本含量较小时,要求样本来自正态分布总体用于成组设计的两样本均数比较时,要求两样本来自总体方差相等的总体。,单样本t检验配对t检验两样本t检验,u检验,用于样本含量足够大(n50),或已知时,样本均数与总体均数的比较,成组设计的两样本均数的比较,单样本u检验两样本u检验,型错误和型错误,型错误拒绝了实际上成立的H0,概率为型错误不拒绝实际上不成立的H0,
7、概率为当样本含量不变时, 越小, 越大;反之, 越大, 越小。同时减少和的方法是增加样本含量1- 称为可信度1- 称为检验效能或把握度,其意义为:若H1成立,用此方法能发现差异的可能性。,0,1,判断正确,型错误,判断正确,型错误,假设检验结论的格式,例1:t=0.58,v=12-1=11,查表,得单侧t0.05,11=0.697,t0.05, 按=0.05的检验水准不拒绝H0,根据本资料尚不能认为该减肥药有效。例2:u=6.132.33,p0.01,按=0.05的检验水准拒绝H0,接受H1,该地健康男性与一般男性血色素含量的差别有统计学意义,可认为该高原地区健康男性血色素含量高于一般男性。,
8、第五章 方差分析(F检验),基本思想,将总变异分成组内变异和组间变异。其中组内变异又称为误差反映个体差异或抽样误差;组间变异可是是来自于抽样误差,也可能是因为处理因素不同造成的。若两组或多组资料是来自同一总体,则组间变异是由于抽样误差造成的,这时组间变异与组内变异的比值即统计量应接近,否则应该明显大于。,应用范围,两个或多个样本均数间的比较分析两个或多个因素间的相互作用回归方程的线性假设检验多元线性回归分析中偏回归系数的假设检验,多个样本均数比较的方差分析的应用条件,各样本是相互独立的随机样本。各样本来自正态分布总体。各总体方差相等,即方差齐。,完全随机设计资料的方差分析单因素方差分析总变异组
9、间变异组内变异(误差)配伍组设计资料的方差分析两因素方差分析总变异处理间变异配伍间变异误差,步骤,建立检验假设,确定检验水准0:组大白鼠的血清谷丙转氨酶浓度含量相等,即: :组大白鼠的血清谷丙转氨酶浓度含量不等或不全相等,即各i不等或不全等。0:各配伍组的血清谷丙转氨酶浓度相等:各配伍组的血清谷丙转氨酶浓度不等或不全相等。均等于0.05,2计算统计量值C=SS总=SS处理SS配伍SS误差SS总-SS处理-SS配伍v总= v处理= v配伍= v误差=MS处理=MS配伍=MS误差=处理误差配伍误差,确定值,做出统计推断以v1=3,v2=21,查界值表,得F0.01(3,21)=4.87,本例102
10、.98,0.01,按0.05的检验水准拒绝,接受,可认为各处理组的大白鼠血清谷丙转氨酶浓度不等或不全相等。以v1=,v2=21,查界值表,F0.01(7,21)=3.65,本例14.026,0.01,按0.05的检验水准拒绝,接受,可认为各配伍组的大白鼠血清谷丙转氨酶浓度不等或不全相等。,多个样本均数间的两两比较,Newman-Keuls检验(q检验),步骤,建立检验假设,确定检验水准。:任两对比组总体均数相等,即A=B H1:任两对比组总体均数不等,即A=B0.052计算统计量q值将各组按样本均数从大到小的顺序排序并注明原组别计算各对比组均数的差值计算各对比组均数差值的标准误计算统计量q确定
11、组数a以组数和自由度查q界值表确定值,做出统计推断,第六章 分类资料的假设检验,服从二项分布资料的假设检验,样本率与总体率的比较直接概率法用于0偏离0.5较远,且阳性数较小并作单侧检验时。根据概率函数直接计算概率,与检验水准比较。正态近似法用于0不太靠近0或1,且样本含量足够大;或n0和n(1-0)均大于5时。,两样本率的比较,服从Poisson分布资料的假设检验,样本阳性数与总体平均数的比较直接计算概率法 用于0小于20,且样本阳性数较小并作单侧检验时 !正态近似法 用于0大于20时,两样本阳性数的比较当两样本阳性数均大于20时,可用u检验。两样本观察单位相同时两样本观察单位不同时,检验,应
12、用范围:推断两个或者多个总体率间或构成比间有无差别,多个样本率比较的 分割,两个变量间有无关联性,频数分布拟合优度的 检验。基本公式:,四格表资料的 检验(用于两样本率的比较)四格表资料 检验的专用公式四格表资料 检验的校正公式,注意事项 当n 40且所有的T5时,用基本公式或四格表专用公式。 当n 40,但有1T5时,用校正公式。 当n40或T1时,用四格表资料的Fisher确切概率法。H0:1= 2,配对四格表资料的 检验 (用于两种处理的比较) 其特点是对样本中各观察单位 分别用2种方法处理,然后观察 2种处理方法的计数结果。 基本公式: (b+c)40时 (b+c)40,+,-,+ a
13、 b,- c d,行列表资料的 检验 专用公式: 多个样本率的比较 H0:1=2=3样本构成比的比较 H0:两组XXX的总体构成比相同双向无序分类资料的关联性检验 H0:两种XXX间无关联 Pearson列联系数,注意事项一般认为,行列表中各格的理论频数不应小于1,并且1T5的格子数不应超过格子总数的五分之一若出现上述情况,可通过以下方法解决:增加样本含量根据专业知识,将理论频数太小的行或列删除或合并改用Fisher确切概率法有序的行列表资料不宜用 检验。,多个样本率比较的 分割法多个实验组间的两两比较实验组与同一对照组的比较,RC表的分类及其检验方法的选择双向无序行列表资料的 检验单向有序分
14、组变量有序,指标变量无序行列表资料的 检验分组变量无序,指标变量有序秩和检验或Ridit分析双向有序属性相同一致性检验(Kappa检验)双向有序属性不同若研究目的为分析不同年龄组患者疗效间有无差别时,可把它视为单向有序资料,选用秩和检验。若研究目的为分析两个有序分类变量间是否存在相关关系,宜用等级相关分析或Pearson积矩相关分析。若研究目的是分析研究两个有序分类变量间是否存在线性变化趋势,宜用有序分组资料的线性趋势检验。,第七章 非参数检验,优点适用范围广,不受总体分布类型的限制对数据的要求不严方法简便,易于理解和掌握缺点若对符合参数检验的资料用了非参数检验,因不能充分利用资料提供的信息,
15、会使检验效能低于参数检验,若要使检验效能相等,往往需要更大的样本含量。,配对设计的符号秩和检验(wilcoxon)配对设计的两样本的比较单一样本与总体中位数比较成组设计两样本比较的秩和检验(wilcoxon)原始数据的两样本比较频数表资料(或等级资料)的两样本比较成组设计多样本比较的秩和检验(H检验/K-W检验)原始数据的比较频数表资料的比较多个样本间两两比较的秩和检验(t检验)随机区组设计资料的秩和检验(M检验)原始数据的比较多个样本间两两比较的秩和检验,配对设计的符号秩和检验(P92),配对设计的两样本的比较建立检验假设,确定检验水准H0:XXX差值的总体中位数为零,即Md=0计算统计量T
16、值求各对的差值编秩按差值的绝对值由小到大编秩,并依差值的正负给秩次冠以正负号。编秩时,若差值为0,舍去不计;若差值的绝对值相等,则取其平均秩次。求秩和并确定统计量T分别求出正、负秩次之和,可任取正秩和或负秩和为统计量T。,确定P值,做出统计推断以T值查“T界值表”,若检验统计量T值在T界值范围内,则P值大于相应的概率水平;若T值在T界值范围外或等于界值,则P值小于或等于相应的概率水平。*n25时,可用正态近似法作u检验若相同秩次较多时(不包括差值为0者),应计算校正的u,单一样本与总体中位数的比较H0:XXX的总体中位数等于XX,M=XX;H1:MXX统计量的计算同上,成组设计两样本比较的秩和
17、检验,原始数据的两样本比较H0:XXX与XXX的总体分布相同计算统计量编秩:将两组数据由小到大统一编秩求秩和并确定统计量T:两组秩次分别相加。若两组例数相等,则取任一组的秩和为统计量;若两组例数不等,则取例数较小者为n1,其对应的秩和为统计量T。确定P值,做出推断以n1,(n2-n1)和检验统计量T值查“T界值表”确定P值。若n1或n2-n1超过10,可用正态近似检验。若相同秩次较多时(比如超过25%),应进行校正。,H0:两种XXX的总体分布相同。计算统计量编秩:各等级的合计人数各等级的秩次范围各等级的平均秩次求秩和并确定统计量:以各等级的平均秩次分别乘以两组相应相应等级的例数,再分别求秩和
18、得到T1、T2。取例数较小者作n1,其秩和作为统计量T。,频数表资料(或等级资料)的两样本比较,成组设计多样本比较的秩和检验(K-W检验或H检验),原始数据的比较H0:X个总体的分布位置相同计算统计量H值编秩:将各组数据统一由小到大编秩。求秩和并计算统计量H确定P值,做出推断结论以N和n1,n2,n3 n i查H界值表。相同秩次较多时(比如超过25%),计算校正值。,频数表资料的比较H0:X个XXX的总体分布相同。计算统计量H:同“频数表资料的两样本比较”。,多个样本间两两比较的秩和检验,随机区组设计资料的秩和检验(M检验),原始数据的比较H0:XXX的总体分布相同。H1: XXX的总体分布不
19、同或不全相同。计算统计量M值编秩:将各配伍组内数据由小到大编秩,相同者取平均。求秩和并计算统计量:求各处理组的秩和Ti;然后计算M值:确定P值,做出推断结论:以处理组数k和配伍组数b查M界值表,得出P值。当处理组数k或配伍组数b超出M界值表的范围时,可采用近似卡方分布法。,多个样本间两两比较的秩和检验(q检验)将各处理组的秩和由小到大排序,并列出各对比组及其包括的组数.计算统计量q 式中,k 为处理组数,b 为配伍组数。以=和组数a查q界值表,得P值。*多个样本间两两比较的总结,医学参考值的范围,正态分布法对数正态分布法百分位数法,总体均数的估计,未知且n小:按t分布的原理未知,但n足够大()
20、,按正态分布原理已知:按正态分布原理,查表法当样本含量较小,如n,特别是p很接近于或时,按二项分布的原理用n和p查“百分率的可信区间表”。正态近似法当样本含量足够大,且样本率p或者1-p均不太小,如np与n(1-p)均大于时,样本率p的抽样分布近似正态分布。,总体率的估计,总体平均数的估计查表法50时,,参数检验,数值变量资料的假设检验样本与总体或两样本比较t检验u检验多样本比较方差分析(检验)分类变量资料的假设检验样本与总体或两样本比较符合二项分布的资料符合Poisson分布的资料多样本率、构成比、关联性的比较卡方检验,第八章直线回归与直线相关,直线相关,直线相关的概念,如果两个随机变量中,
21、当其中一个变量由小到大变化时,另一个变量相应的由小到大(或由大到小)变化,并且其相应变化的散点图在直角坐标系中呈现直线趋势,则称这两个随机变量存在直线相关。推断两个变量是否存在相关关系以及这种相关关系大小的分析方法就是直线相关分析,也称为简单相关分析。正相关、负相关、零相关、完全相关。,相关系数的意义及计算,直线相关系数(简相关系数)取值范围是在-1,1区间上。总体用表示,样本用r表示。,相关系数的假设检验,0:,即认为两变量间不存在直线相关。1:,即认为两变量间存在直线相关。计算统计量,总体相关系数的区间估计,对相关系数r作z变换估计z的可信区间对z的可信区间进行逆变换,直线相关分析时的注意
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 课件

链接地址:https://www.31ppt.com/p-1295316.html