医学统计学填空,名词解释简答.docx
医学统计学填空,名词解释。简答1、常用的统计学资料类型分计量、计数和等级 2、正态分布的两个参数是位置参数和形态参数 3、统计推断包括两个重要方面是参数估计和假设检验 5、方差分析的应用条件是,1样本来自正态整体2方差极性3独立样本资料 15、欲比较两组均数相差较大的资料的离散程度宜用变异系数 15、统计学将p0.05或平0.01定为小概率事件 16、概率是以符号p表示,其取值波动于01之间 20、估计医学正常值的方法有正态法和百分位数法,它们分别用于正态分布资料和偏态分布 资料 25、常用的相对数率、构成比、相对比 40、x2值是反映实际频数和理论频数的吻合程度 50、根据资料的内容和性质选用合适的统计图 53、实验设计的基本原则是对照原则、均衡原则、随机原则和重复原则 64、& 是指样本均数对u的离散程度&x-是指均数的均数对u的离散程度 名词解释 1.总体:population总体指根据研究目的所确定的同质观察单位的全体,更确切的说,是同质的所有观察单位某项观察值的集合 2.样本:sample从总体中随机抽取部分观察单位其某项观察值的集合称为样本。 3.变异:即个体间的差异,是生物医学数据最显著地特征。 4.变异系数:coefficient of variation用CV表示,即标准差与算术均数之比,描述了观察值的变异相对于其平均水平的大小。 5.相对数:relative number是两个有关联的数值或指标之比称为相对数。是分类变量常用的描述性统计指标,常用相对数有率、构成比、相对比。 6、四分位数间距quartile range、用Q表示,就是上四分位数与下四分位数之差,即P75-P25。间距越大,说明资料的离散程度越大。 7、均方:将各部分离均差平方和除以相应自由度,其比值称为均方差简称均方。 8、标准误:standard error统计学把样本均数的标准差称为均数的标准误。标准误是描述均数的抽样误差大小的统计指标,标准误越大,抽样误差越大。 9、可信区间:CI又称置信区间,根据一定的置信度进行估计得到的区间,称为置信区间。其置信度要预先确定。 10统计量:statistic根据样本个体值计算得到的描述样本特征的量称为统计量。 11、百分位数:percentile是一种位置指标。将n个观察值从小到大排列,分成100等分,各等分含1%的观察值,则地X百分位次对应的数值称为第x百分位数,用Px表示。 12.标准差:standard deviation是方差的算术平方根,总体标注差用6表示,样本标注差用s表示。 13、正态分布:normal distribution若资料X的频率曲线对应于数学上的正态曲线,则称该资料服从正态分布。通常用记号N(m,s2)表示均数为m,标准差为s的正态分布。 14、概率:probability 概率是反映某一随机事件发生的可能性大小的指标用符号P表示。 15.参数:parameter描述总体特征的量,称为参数。它是根据总体全部个体值计算得出。一般是未知或假设的,但可以通过样本指标进行估计。 16、统计推断statistical inference 根据带随机性的观测数据(样本)以及问题的条件和假定(模型),而对未知事物作出的,以概率形式表述的推断。它是数理统计学的主要任务,其理论和方法构成数理统计学的主要内容。 17、率的标准误:standard error of rate反映率的抽样误差大小的指标,它实际上是样本率的标准差。率的标准误可用来估计率的抽样误差。率的标准误越小,率的抽样误差也越小。 18.检验效能:1-b称为检验效能,它是指当两总体确有差别,按规定的检验水准a所能发现该差异的能力。 19、抽样误差:sampling error抽样误差是由抽样引起的样本统计量与总体参数之间的差异。这是由于总体中个体存在着变异,样本是由总体中部分个体所组成,故所得的样本统计量与总体参数之间存在差异。 20、系统误差:systematic error是指由于仪器未校准好、测量者感官的某种倾向、研究者掌握的标准偏高或偏低等原因,使观察值不是随机分散在真值两侧,而是有方向性、系统性或周期性地偏离真值这类误差称为系统误差。 21、分层抽样先将总体中全部个体按某种特征分成若干“层”,再从每一层内随机抽取一定数量的个体组成样本。分层特征与研究目的有关。按各层比例抽样。为减少抽样误差,要求层内误差最小,层间误差最大。 22、随机抽样:按照随机的原则,即保证总体中每一个对象都有已知的、非零的概率被选入作为研究的对象,保证样本的代表性。 23、参数估计:指用样本统计量估计总体参数。参数估计有两种方法:点估计和区间估计。 24、率是指在一定观察时间内某现象实际发生数与可能发生该现象的总数之比。用以说明某现象发生的频率或强度。常以百分率千分率、万分率等表示。 25、构成比constituent ratio 是指事物内部某一部分的观察单位数与该事物内部各组成部分的观察单位数总和之比,用以说明事物内部各部分所占的比重或分布。 26比又称相对比,是A、B 两个有关指标之比,说明A 是B 的若干倍或百分之几。计算公式为:A/B ,表示方式有:倍数或分数等。 27参数统计:通常要求样本来自总体分布型是已知的,在这种假设的基础上,对总体参数进行估计和检验,称为参数统计(parametric statistics) 问答题 1什么叫做抽样误差,抽样误差产生的原因,如何度量抽样误差的大小? 答:抽样误差是指由抽样引起的样本统计量与总体参数之间的差异。 产生原因:抽样误差的产生是由与总体中各个体存在着变异,样本是由总体中部分个体所组成,故所得的样本统计量与总体参数之间存在差异。 抽样误差可用标准误估计。 2、标准差和标准误的区别和联系? 1答:标准差和标准误都是变异指标,但它们之间有区别,也有联系。 区别: 概念不同;标准差是描述观察值(个体值)之间的变异程度;标准误是描述样本均数的抽样误差; 用途不同;标准差与均数结合估计参考值范围,计算变异系数,计算标准误等。标准误用于估计参数的可信区间,进行假设检验等。 它们与样本含量的关系不同: 当样本含量 n 足够大时,标准差趋向稳定;而标准误随n的增大而减小,甚至趋于0 。 联系: 标准差,标准误均为变异指标,当样本含量不变时,标准误与标准差成正比 2答、均数标准误大小与样本标准差大小成正比,与样本含量的平方根成反比。标准误越小,说明样本均数作为总体均数估计值的准确性越大。 意义 符号 均数的标准误 反映样本均数抽样误差的大小 标准差 反映一组个体值的变异程度 sXsX=, SXs总体标准差 ,样本标准差 Ss=S= -m)å(X2s nSn计算 公式 NSX=å(X-X)n-12控制方法 增大样本含量可减小标准误 个体差异或自然变异不能通过统计方法来控制 试说明x+-1.96s与x+-1.96Sx的区别x±1.96s表示的是正态分布的变量的95的参考值范围即正常人群中95%的人该指标的取值范围,而x±1.96Sx表示的是总体均数的双侧95的置信区间即该可信区间有95%可能性包括了总体均数。假设检验的基本步骤 建立假设,确定检验水准。双侧检验,Ho:uuo.Hi:uuo单侧检验则H1:uuo 0.05建立检验方法和计算检验统计量。确定P值和做出推断结论。 3、进行参数估计时应考虑哪些问题?参数估计是指用样本指标推断总体指标,包括点估计和区间估计,进行参数估计时,要注意样本容量不能太小,在进行样本选择时要具有代表性,尽量减少误差, 4、可信区间的含义是什么?应用可信区间时应注意哪些问题?又称置信区间,根据一定的置信度进行估计得到的区间,称为置信区间。其置信度要预先确定。应用可信区间时要注意准确度和精密度,准确度反应可信度的大小即区间包含总体均数的概率的大小,越准确越好,精确度反应区间的大小长度越小越好。 可信区间与假设检验有什么区别与联系?1可信区间用于推断总体参数所在的范围,假设检验用于推断总体参数是否不同,前者估计总体参数的大小后者推断总体参数有无质的不同,2可信区间也可以回答假设检验的问题,但可信区间不能提供确切的P值范围,只能给出在a水准上有无意义。3可信区间还可提示差别有无质的不同。 5、假设检验时,一般认为p0.05时,则拒绝H0,理论依据是什么?答:P值是指从H0规定的总体随机抽得等于及大于(或/和等于及小于)现有样本获得的检验统计量值(如t或u)的概率。当P<0.05时,说明在H0成立的条件下,得到现有检验结果的概率小于通常确定的小概率事件标准0.05。因小概率事件在一次试验中几乎不可能发生,现的确发生了,说明现有样本信息不支持H0,所以怀疑原假设H0不成立,故拒绝H0。在下“有差别”的结论的同时,我们能够知道可能犯I型错误的概率不会大于0.05(即通常的检验水准),这在概率上有了保证。 6、t检验与u检验应用条件有哪些? t检验的应用条件是:未知而且n较小时,要求样本来自正态总体;两小样本均数比较时,还要求两样本所属总体的方差相等。u检验的应用条件是:已知;未知但样本含量较大。 7、为什么说随机化配对设计比两组完全随机化设计的实验效率要高? 8、试诉应用相对数应注意的问题? 答:1、正确区分构成比和率。2、计算构成比或率时分母不能太小3、正确计算平均率4、注意资料的可比性5、样本率或样本构成比进行比较时要做假设检验。 9、一型错误与二型错误的区别和联系,了解这两型错误有何实际 意义? 10、随机去组设计的方差分析与完全随机设计方差分析在设计方差分析在设计和变异分解上有什么不同? 11、正态分布与标准正态分布的联系与区别? 12、试举例说明均数的标准差与标准误的区别于联系? 13、为什么假设检验的结论不能绝对化? 答:因为通过假设检验推断作出的结论具有概率性,其结论不可能完全正确,有可能发生两类错误。拒绝H0时,可能犯I型错误;“接受”H0时可能犯II型错误。无论哪类错误,假设检验都不可能将其风险降为0,因此在结论中使用绝对化的字词如“肯定”,“一定”,“必定”就不恰当。 14、怎样正确使用单侧检验与双侧检验? 单双侧检验首先应根据专业知识来确定,同时也应考虑所要解决问题的目的。若从专业知识判断一种方法的结果可能低于或高于另一种方法的结果,则用单侧检验。在尚不能从专业知识判断两种结果谁高谁低时,用双侧检验。若研究者对低于或高于两种结果都关心,则用双侧检验;若仅关心其中一种可能,则取单侧检验。一般认为双侧检验较保守和稳妥,单侧检验由于充分利用了另一侧的不可能性,故更易得出有差别的结论,但应慎用。