《计量资料的统计介绍.ppt》由会员分享,可在线阅读,更多相关《计量资料的统计介绍.ppt(33页珍藏版)》请在三一办公上搜索。
1、第二章,集中趋势和离散趋势(计量资料的统计描述),主要内容,频数表集中趋势离散趋势正态分布正常值范围估计,3,原始资料,一.频 数 表,频数:当汇总大量的原始数据时,把数据按类型分组,其中每个组的数据个数,称为该组的频数。频数表(频数分布):表示各组及它们对应的组频数的表格称为频数表或频数分布。,1998年100名18岁健康女大学生身高的频数分布,6,频数表的编制,1.求全距(R):R=最大值 最小值=173.6 154.7=18.9(cm)2.确定组数:通常815组 计算组距(i)i=R/组数 i=18.9/10=1.89 cm 取整数 2 cm 所以,i=2 cm3.确定组段:第一组段包括
2、最小值,如本例为154 最后组段包括最大值,如本例1721744.列表划记,频数分布的两个特征:集中趋势与离散趋势频数分布的类型:对称分布与偏态分布(集中位置偏向小的一侧叫正偏态,反之叫负偏态)频数表的主要用途:1.揭示分布类型 2.发现特大值和特小值 3.计算集中趋势指标与离散趋势指标,8,9,10,11,二、集中位置的描述,常用几种平均值:1.算术均数2.几何均数3.中位数,常用平均值来描述。平均值是一组数据典型或有代表性的值。由于这样典型的值趋向于落在根据数据大小排列的数据的中心,因此可以用于度量集中位置(位置指标),12,1.算术均数(均数),意义:一组性质相同的观察值在数量上的平均水
3、平。表示(总体)X(样本)计算:直接法、间接法、计算机特征:(X-X)=0 估计误差之和为0。应用:正态分布或近似正态分布注意:合理分组,才能求均数,否则没有意义。,100名18岁女大学生身高均数的计算(加权法),14,2.几何均数,意义:N个数值的乘积开N次方即为这N 个数的几何均数。表示:G 计算:应用:原始数据分布不对称,经对数转换后呈对称分布的资料。例如抗体滴度。,15,3.中位数、百份位数,意义:将一组观察值从小到大排序后,居于中间位置的那个值或两个中间值的平均值。将N个观察值从小到大依次排列,再分成100等份,对应于X%位的数值即为第X百分位数。中位数是百分位的特殊形式。同样的例子
4、还有四分位数、十分位数等。表示:M、PX计算:应用:偏态资料,开口资料,16,三、离散程度的描述,描述一组数据参差不齐的程度全距四分位数间距方差标准差变异系数,17,1.全距、四分位数间距R:见上。Q:上四分位数(P75)Qu与下四分位数Ql(P25)之差,包含了全部观察值的一半。,18,2.标准差,相关概念:离均差、离均差平方和、方差(2 S2)标准差的符号:S 标准差的意义:全面反映了一组观察值的变异程度.(越大说明围绕均数越离散,反之说明较集中在均数周围,均数代表性越好)标准差的计算(公式):标准差的应用:描述变异程度、计算标准误、计算变异 系数、描述正态分布、估计正常值范围,19,3.
5、变异系数,意义:标准差与均数之比用百分数表示。符号:CV计算:CV=(S/X)100%无单位应用:单位不同的多组数据比较 均数相差悬殊的多组资料,20,四、正态分布,1、图形2、特征3、面积,21,1、正态分布的图形,22,正态分布,23,2、正态分布的特征,均数处最高;均数为中心对称;2个参数 N(u,)正态分布的特殊形式:标准正态分布N(0,1);标准正态变换(变换公式);例题:一次统计测验的平均分是72,标准差是15,求60分、93分、72分的标准分数。曲线下的面积有一定规律。,24,3、曲线下面积,25,正态曲线下的面积特点,P117 为标准正态分布下的面积横轴上曲线下的面积为1曲线下
6、,横轴上对称于0的面积相等从-到;u,已知时,进行标准正态变换再查表u,未知时,用样本的均数和标准差代替95%,99%的面积公式:,定义:又称参考值范围,是指特定健康人群的解剖、生理、生化等各种数据的波动范围。习惯上是确定包括95%的人的界值。单双侧:根据指标的实际用途,有的指标有上下界值,过高过低均属异常;某些指标过高为异常,只需确定上限;某些指标过低为异常,只需确定下限。估计的方法:1、正态分布法2、百分位数法,五、医学正常值范围的估计,1.正态分布法应用条件:正态分布或近似正态分布资料 计算(双侧)95%正常值(医学参考值)范围公式:(x1.96 S,x1.96 S)即(x1.96 S)
7、上例:(163.841.96 3.79,163.841.96 3.79)即(156.41 cm,171.27 cm),28,已知:x=119.95cm,s=4.72cm.试问:(1)估计该地7岁男童身高在110cm以下者 占该地7岁男童的百分比。(2)估计该地7岁男童身高在130cm 以上者占该地7岁男童的百分比。(3)估计该地7岁男童身高在107.77cm到 132.13cm之间的占该地7岁男童的百分 比。,例题:某市1982年110名7岁男童的身高,29,2.百分位数法,P19例题 应用条件:偏态分布资料 计算公式:双侧界值:P 2.5 P 97.5 单侧 上界:P 95 单侧 下界:P 5,30,小结习题:1.各观察值加同一数后:A.均数不变,标准差改变 B.均数改变,标准差不变C.二者均不变 D.均改变2.用均数和标准差可全面描述:A.正偏态资料 B.负偏态资料 C.正态分布和近似正态分布 D.任何分布3.正态分布曲线下,从均数u 到u+1.96的面积为;A.95%B.45%C.97.5%D.47.5%,31,P22 1976年美国8岁男孩的平均身高为146厘米,标准差为8厘米,估计在该研究中有%多少的男孩平均身高在138与154之间?又有多少在130到162之间?,32,33,
链接地址:https://www.31ppt.com/p-6059917.html