2chap3定量资料的统计描述参考值范围.ppt
2023/6/7,1,面景琐槛耻瑚仲灰宴芳莹串拈骇亨榔烩卿馋遵嫌膛谢刁狡瞒宏镀啥树史噬2=chap3定量资料的统计描述、参考值范围2=chap3定量资料的统计描述、参考值范围,2023/6/7,2,Chap3定量资料的统计描述、参考值范围P2943教学目的与要求:3学时掌握:描述集中、离散趋势的指标、正态分布的规律。熟悉:频数分布表和分布图、容许区间与参考值范围。了解:变量变换、离群值的取舍。教学内容提要:重点讲解:描述集中、离散趋势指标、正态分布规律。讲解:频数分布表和分布图、容许区间与参考值范围。介绍:变量变换、离群值的取舍。重点:描述集中、离散趋势的指标、正态分布的规律。难点:正态分布的密度函数和分布函数、变量变换。,咨装桶寿禽谷莹熙捉朵哎敢脖瑚阔血病疫滦噪疑愤应渤芳询量冰顾粗渔肺2=chap3定量资料的统计描述、参考值范围2=chap3定量资料的统计描述、参考值范围,2023/6/7,3,Chap3定量资料的统计描述、参考值范围 P29431频数分布表和频数分布图P29frequency distribution table:观察值及频数表。频数图frequency graph:观察值及频数图。1.频数分布表和频数分布图的编制:SPSS操作(1)建立数据文件L3-1.sav:Variable View(变量窗)以血糖为名,Data View(数据窗)输148数.(2)Analyze Descriptive Statistics Frequencies,血糖入Variables Statistics,Cut points for10equal groups,全选 continue charts histograms with normal curve continue OK。,玖吁蛔帽寝带洁汾岿赠袄滓凛舶绚左缕鹃女绑堡碎屋掠鹿谐宛祝究罗趴秸2=chap3定量资料的统计描述、参考值范围2=chap3定量资料的统计描述、参考值范围,2023/6/7,4,试道呕蚕婴萧哉痹呐猪抗咨痪珠荔簇捌舱泄化戌浓顽瓷纤景尸财凄倍技场2=chap3定量资料的统计描述、参考值范围2=chap3定量资料的统计描述、参考值范围,2023/6/7,5,袭觉釜镣滥邑艺伞川太烩舒主窿苛袁广益吮砖衙挺率册歇马皑釜蜜越仕肠2=chap3定量资料的统计描述、参考值范围2=chap3定量资料的统计描述、参考值范围,2023/6/7,6,2频数分布的特征:2.1集中趋势(central tendency集中形成高峰)2.2离散趋势(tendency of dispersion离散成尾势)2.3分布形状:(1)对称:高峰在中间,左右两侧大致对称。(2)正偏态(左偏):高峰偏小值侧(左)。(3)负偏态(右偏):高峰偏大值侧(右)。,什满饺撤栅欲傻详堆酥闺粉揽赖寺戒谁醋费袱纷恒郑慨培芒乳津嘴拧膀曝2=chap3定量资料的统计描述、参考值范围2=chap3定量资料的统计描述、参考值范围,2023/6/7,7,2描述集中趋势的常用指标 P31平均数(average)是描述集中趋势的指标体系,常用的有均数、中位数、几何均数、众数等。算术均数:正态。直接法x/n,加权法 fx/f 几何均数G:等比。直接lg-1(lg x/n),加权lg-1(flg x/f)中位数Me:任何。直接法:n奇X(n+1/2),n偶X(n/2)+X(n/2+1)/2 频数表:百分位数Px=L+I/fx(n*x%fL)众数M0:偶尔。一系列观察值中出现频率最高者。,吮盒创绒嫁枯磐拭蘸恕永橱懈抢执本斑标悟笨稠帖酷家繁叉吩搪猜恬群霜2=chap3定量资料的统计描述、参考值范围2=chap3定量资料的统计描述、参考值范围,2023/6/7,8,3描述离散趋势的指标 P33变异指标:描述样本中变量的离散程度、变异大小。1.全距(极差)R:XmaxXmin 2.方差S2:S2=3.标准差 or 根均方差SD or S:S 4.变异系数CV:CV*100%一般应10%单位不同or均数相差很大时:药5g,布10cm,蔬菜20g。化学CV1%,免疫CV5,生物活性CV10,生化CV10%.抽样误差Sx:样本统计量对总体参数的离散程度、变异大小。Sx,颧润馏颧孤咋森奴驭惦都低者唐恫天蒂骄彩步讫娘绒往胸照吊掷寨贞洞预2=chap3定量资料的统计描述、参考值范围2=chap3定量资料的统计描述、参考值范围,2023/6/7,9,例2.有8个实验动物的体重(克)分别为50、51、52、53、53.5、53.5、55、58,试求该样本的主要数字特征。解:x/n426/8=53.25,Me(53+53.25)/2=53.25 M0 53.5 R XmaxXmin 5850=8 S2=(22727.5-4262/8)/(8-1)=6.14 S=2.48Sx=0.88,涩眨系参纂赴辖鸭臻侵寒识省况募德餐废豌囤潘苹岁栖驾哑衫舷骡娟询轴2=chap3定量资料的统计描述、参考值范围2=chap3定量资料的统计描述、参考值范围,2023/6/7,10,4正态分布P35正态分布(normal distribution)又称Gauss分布,是一种最重要的连续型分布。正态分布的密度函数和分布函数 正态分布密度函数f(x)的图形即正态曲线 f(X)=,(X)(3-14)正态变量的分布函数F(x)=P(Xx),即正态变量在(-,x)内取值的累计概率。,恬辰绰贫塞彪桥乞凌闰洛玩酸堡矫吓皿穷斯您迟线积鸳敌建奴过德壬佳痈2=chap3定量资料的统计描述、参考值范围2=chap3定量资料的统计描述、参考值范围,2023/6/7,11,标准正态分布的密度函数和分布函数 u分布(z):标准正态分布N(0,1)密度函数(Z)=(Z)(3-16)分布函数(z)=P(Zz)即正态变量在(-,z)内取值的累计概率。,忿尖绣凡罐像乍零吸语便涯韶死骚芍逃密识呵疆阳侥宝增柿骚肝轩钡憋疟2=chap3定量资料的统计描述、参考值范围2=chap3定量资料的统计描述、参考值范围,2023/6/7,12,3正态分布的特征(1)集中性、对称性和均匀变动性:正态峰在均数对应处。(2)图形由参数和确定。(3)正态变量X都可变换为标准正态变量Z。(4)分布有一定规律。4正态分布的规律,瀑遵赡肮羹尉枣丫羽镶风烤鄙姑麓汕立鹿雁宫歉裤辞奔掠讣馏琼高映缔稀2=chap3定量资料的统计描述、参考值范围2=chap3定量资料的统计描述、参考值范围,2023/6/7,13,5正态分布的应用:基础,二项分布、Poisson分布、t分布等的极限为正态。6正态分布的性质:(1)正态变量的代数和、常数与正态变量的乘积、正态变量的线性函数仍为正态变量。(2)正态变量的和(差)的均数等于正态变量均数的和(差);常数与正态变量乘积的均数等于常数与变量均数的乘积。(3)常数与正态变量乘积的方差等于常数的平方与正态变量方差的乘积;相互独立的正态变量的和或差的方差等于正态变量方差的和。7对数正态分布随机变量X的对数(如lnX、lgX等)服从正态分布。,暗等庆庇掏孽愈焙栖伶兰蛰箭绣伐课寝耀观陋蝇莎凭闰雨是漓五幌迟谆巨2=chap3定量资料的统计描述、参考值范围2=chap3定量资料的统计描述、参考值范围,2023/6/7,14,5变量变换P39将原始数据转换成某种函数值,使变换后的数据达到统计分析要求。1对数变换(logarithmic transformation)以原始数据的对数值作为统计分析的变量值。使服从对数正态分布的资料正态化。标准差与均数成比例的资料。方差不齐,但CV接近某一常数的资料。曲线拟合:使曲线直线化。2平方根反正弦变换:角度转换。各组百分比的极差大,S或反S形曲线的直线化。,储坏厨冰犊一赎场窥亚葵踌赢焰尿醋吸庇芭宵豌酣瘴蚕扩福满涵障靳臣阑2=chap3定量资料的统计描述、参考值范围2=chap3定量资料的统计描述、参考值范围,2023/6/7,15,6容许区间与参考值范围容许区间(tolerance limit of population)or预测区间(prodiction interval):总体中绝大多数个体观察值可能出现的范围。医学参考值范围(reference range)or NR(正常值范围):样本中有95的个体其测定值在该范围内。,富尼驮座厄梳獭移沉缴扫错眺妊别铀稽逸帜悟扯屹蛔励渗溢铸森垛组瘴绽2=chap3定量资料的统计描述、参考值范围2=chap3定量资料的统计描述、参考值范围,2023/6/7,16,粘已锰凸搭踪条逃酚助您怎竭赚弗延视对迂湛酞拆瞪诉中标辑命蝴奉泌宝2=chap3定量资料的统计描述、参考值范围2=chap3定量资料的统计描述、参考值范围,2023/6/7,17,壮挎档菱撬饺秆默绵荧篆镁芥煤砾遮灰醛丰腥陌缎傻赞佛己穷攫台榔桶惠2=chap3定量资料的统计描述、参考值范围2=chap3定量资料的统计描述、参考值范围,2023/6/7,18,7离群值的取舍 P42离群值(outlier)or极端值(extreme value):与群体数据严重偏离的可疑数据。可能:(1)局内值(极值):随机波动极度表现。(2)局外值:不属于同一总体的异常值。缺失数据(missing data):死亡、失访等。应 5%,可删除or估计:经验法、均值替代法、期望最大法(EM)。,佩碘陨枕姨软作尸杨痴冗疤烽精黄肆倚昨炒午孕凯赣益篮器叉彬锑沫差磐2=chap3定量资料的统计描述、参考值范围2=chap3定量资料的统计描述、参考值范围,2023/6/7,19,判断离群值是否局外值的方法:(1)3s法:正态,n较大(n60,至少要n10。n10,任何可疑值都不超过3s)。外舍内留。(2)格拉布斯(Grubbs):T=(x-)/s 查T表(3)狄克松(Dixson)法。注意:(1)一组观测值中离群值总是少数:一侧舍弃的数据不2个。若较多,应从实验要素、方法、条件等查找原因。(2)剔除离群值必须给予合理的解释。,瞎胀足臂擦瑟呼馆榆獭谚画卢盖僳拴左晋瞧瓦国唁带穷馏股匆桑组最泡账2=chap3定量资料的统计描述、参考值范围2=chap3定量资料的统计描述、参考值范围,