《SPSS统计分析基础.ppt》由会员分享,可在线阅读,更多相关《SPSS统计分析基础.ppt(77页珍藏版)》请在三一办公上搜索。
1、SPSS统计分析基础,主要统计分析软件,1 SAS(Statistics Analysis System)美国的SAS软件以其强大的数据管理能力、全面的统计方法、高精度的计算以及独特的多平台自适应技术,成为统计软件包的标准,被国内外许多学者誉为最权威的统计软件包。20世纪80年代进入中国。但该软件操作复杂,不能为广大普通用户接受,仅适合专业统计人员使用。2 SPSS(Statistical Package for Social Sciences)(Statistical Product and Service Solutions)已被广泛应用于自然科学、社会科学各个领域中,如工程技术、应用数学
2、、经济学、商业、金融、生物学、教育、医疗卫生、体育、心理学、管理学、农林等。3 BMDP(Biomedical Computer Programs)该软件包曾和SAS、SPSS共称为三大统计软件包,在国际上影响很大。它方法全面、灵活,早期曾有很多独具特色的分析方法。不过其发展路途不畅,从1991年的7.0版本以后就没有推出新版本,最后被SPSS公司收购。,二、SPSS主要窗口与功能,1 变量编辑窗口(Variable View),二、SPSS主要窗口与功能,变量名的定义,二、SPSS主要窗口与功能,数值型(Numeric):系统默认“Width”(整数位宽度)“Decimal Places”(
3、小数位数)逗点数值型园点数值型科学计数法型日期型美元记号型习惯金融记号型(自定义型)字符型(String):不能进行运算,可输汉字。“Characters”(可存字符数),变量类型、宽度、小数位,二、SPSS主要窗口与功能,变量标签 对变量做出解释,输入字符。标量值标签 解释变量值的含义,对等级变量或名义变量尤其有用。如1,男;2,女。缺失值,二、SPSS主要窗口与功能,列宽 用以控制数据编辑窗口中的数据值占用的宽度。对齐方式 数值型变量默认为右对齐,字符型变量默认为左对齐。变量测度 选择相应的变量测度:尺度型(Scale)名义型(Nominal)等级型(Ordinal),二、SPSS主要窗口
4、与功能,2 数据编辑窗口(Data View),行:代表观察个体(例,Case)列:代表观察到的变量(Variable)数据格:观察值,二、SPSS主要窗口与功能,二、SPSS主要窗口与功能,二、SPSS主要窗口与功能,二、SPSS主要窗口与功能,二、SPSS主要窗口与功能,二、SPSS主要窗口与功能,3 结果浏览窗口(Viewer),左侧为输出大纲窗口右侧为内容窗口浏览窗口的内容可保存为多种文本,如 Word(Word/RTF file)PPT(PowerPoint),二、SPSS主要窗口与功能,二、SPSS主要窗口与功能,三、计量资料常用统计分析,(一)计量资料的参数检验1 描述性分析 均
5、值及标准差 应用条件(1)样本资料符合正态分布。(2)单样本数据:一般说每组例数60例。两样本数据,一般说两组例数之和 60例,而且例数 基本均等。(3)理论上,要求单样本是从总体中随机抽取,两 样本为随机分组资料。观察性资料要求组间具 有可比性,即比较组之间除了研究因素以外,其他可能有影响的非研究因素均应相同或相近。,正态性检验的两种计算方法,(1)Explore法检验是否符合正态分布,三、计量资料常用统计分析,例3-3,三、计量资料常用统计分析,上表中:N50,采用K-S方法。N50,采用K-W方法。本例符合正态分布,(2)非参数检验中单样本K-S法检验是否符合正态分布,三、计量资料常用统
6、计分析,均值及标准差的SPSS统计分析,例 data1-2,三、计量资料常用统计分析,SPSS统计方法,三、计量资料常用统计分析,三、计量资料常用统计分析,2 计量资料样本均数的比较,t 检验的应用条件当样本含量较小时,理论上要求样本为来自正态分布总体的随机样本;当两小样本均数比较时,要求两总体方差相等(方差齐性)。在实际工作中,若上述条件略有偏离,仍可进行t 检验分析。,三、计量资料常用统计分析,(1)样本均数与已知总体均数比较单个总体均数的 t 检验,例5-1,SPSS统计方法,该方法测得的结果与标准浓度值有所不同。,三、计量资料常用统计分析,统计结果,采用题中所指方法测量该标准浓度溶液的
7、效果欠佳。,三、计量资料常用统计分析,单侧检验与双侧检验,单侧检验(2-sided,2-talled):需注明。例如,健康男子脉搏平均72次/m,山 区25名男子脉搏平均74.2次/m,二者是否一致?此时根据经验知山区脉搏 快,故应取单侧(正侧)。单侧检验更容易得出有差异的结论。双侧检验(1-sided,1-talled):一般比较保守的以双侧为好。不注明时均表示 为双侧检验。,例,(2)两个独立样本均数比较 独立样本的 t 检验,三、计量资料常用统计分析,SPSS统计方法,三、计量资料常用统计分析,本例方差齐,所以看上行结果,p=0.065。两种膳食对小鼠体重无明显影响。,(3)配对样本均数
8、比较配对样本的 t 检验,配对资料包括:(1)同对(年龄、性别、体重、病况等非处理 因 素相同或相似者);(2)同一研究对象分别给予两种不同处理的效果 比较;(3)同一研究对象处理前后的效果比较。,三、计量资料常用统计分析,应用条件 理论上,计量资料的配对样本均数比较时,各样本均应来自正态总体。由于受严格配对条件的限制,此时多为小样本资料,此时个别书籍中提出对资料的分布类型不做要求。(李竹,郑俊池.新编实用医学统计方法与技能,中国医药科技出版社,北京,1997,p63),例 两个配对变量的t检验,SPSS统计方法,三、计量资料常用统计分析,统计结果:,两种饲料喂养的大白鼠肝中Vit A含量差别
9、有统计学意义。,三、计量资料常用统计分析,例 多个配对变量的 t 检验,抽取8批溶液,每批分成3分,分别由甲、乙、丙三种分离机析出某种物质,数据如表。问析出效能有无差异?,SPSS统计方法,与两配对变量的t检验相似,将甲、乙、丙三个变量两两配对,进入“Paired-Sample T Test”,其余使用默认值。,上图:X,S中图:相关关系下图:两两比较结果:甲-乙、甲-丙有 差异,乙-丙无 差异。,(4)两个以上样本的均数比较:单向方差分析,方差分析的应用条件 各组样本是相互独立的随机样本。均来自正态总体。各组总体方差相等,即方差齐性(homoscedasticity)。例5-4,三、计量资料
10、常用统计分析,SPSS统计方法,注意:此时应用两样本均数比较的t检验,不仅麻烦,而且使假设检验犯I型错误的概率增大。原则上不能应用。如果误用上述方法,应改变P值的标准:P=0.05/比较次数,三、计量资料常用统计分析,统计结果,不同时期切痂对大鼠肝脏ATP含量有影响。,三、计量资料常用统计分析,(5)两个以上样本的均数间两两比较Q检验(事后检验,Post Hoc),方差分析中,P0.05只说明各水平的均数不全相等,并不排除某两个或某几个水平均数相等的情况,因此需做均数间的两两比较。例5-4。,三、计量资料常用统计分析,Post-Hoc 统计方法,Analyze Compare Means On
11、e-Way Anova 选择分析变量进入Dependent List 选择分组变量进入Factor 选择“Post-Hoc”选择Post-Hoc方法:方差齐时有14种,最常用Bonferroni,S-N-K.方差不齐时有4种,最常用Games-Howell.OK,三、计量资料常用统计分析,A与B比较:P0.0001A与C比较:P=0.162B与C比较:P0.0001,(6)随机区组设计的两个以上样本的均数比较双向方差分析,例5-5,三、计量资料常用统计分析,SPSS统计方法注意正确输入数据,第1行:对整个模型的检验:F=28.561,p=0.000,整个模型有统计学意义。第2行:对处理组tre
12、at的检验:F=16.603,p=0.000,表明不同浓度的血水草总生物 碱对尾蚴存活率有影响。第3行:对区组变量block的检验:F=1.887,p=0.078,表明不同区组的小鼠尾蚴 存活率总体均数相等。,方差,标准差的平方。两小样本比较的t检验,要求样本所在的总体方差相等,但由于存在抽样误差,即使两总体方差相等,样本方差也会有差别。方差齐性检验用来判断两个总体方差是否齐。方差齐性检验:(1)两个独立样本的方差齐性检验:如前述,在结果中看上行或下行。(2)单向方差分析时的方差齐性检验:例5-4.,三、计量资料常用统计分析,P0.05,表明方差齐。,三、计量资料常用统计分析,(3)双向方差分
13、析时的方差齐性检验:例5-5。,继续以下步骤以分别检验treat与block方差齐性,单击“Option”选择“Homogeneity tests OK.然后再将“Block”选入“Fixed Factor”单击“Option”选择“Homogeneity testsOK.,上表为各处理组的方差齐性检验:方差齐。下表为各区组的方差齐性检验:方差齐。,(二)计量资料的非参数检验,非参数检验不受总体分布的限制,是总体不服从正态分布或分布情况不明(包括不服从正态分布的计量资料、计数资料、等级资料)时的检验方法。适合参数检验的资料,应首选参数检验。此时 如果选用非参数检验,其效率约为参数检验方法的 9
14、5%,常需要更多的样本例数才能检验出参数检验 方法所能检出的同样大小的差异。,主要介绍以下4种计量资料的非参数检验:(1)两个独立样本检验(2)多个独立样本检验(3)两个相关样本检验(4)多个相关样本检验,(1)两个独立样本检验,例 某实验室观察局部温热治疗小鼠移植肿瘤的疗效,以生存日作为观察指标,实验结果如表。问小鼠生存日有无差别?欲知两个独立样本的均数、中位数、离散趋势,最终确定两样本是否服从相同分布。,SPSS检验步骤,AnalyzeNonparametric Tests2 Independent Samples分别进入实验变量,分组变量单击“Define Groups”,赋值1,2Co
15、ntinue在“Test Type”中选择一种方法(默认第一种)OK,P=0.000,两组生存日数有差异。,(2)多个独立样本检验,例 三组血浆总皮质醇测定值(g/L),试比较是否有差异?,SPSS检验步骤,AnalyzeNonparametric Testsk Independent Samples分别进入实验变量,分组变量单击“Define Groups”,赋值1,3Continue在“Test Type”中选择一种方法(默认第一种)OK,结果:差异有显著性,第3组高于前两组。,(3)两个相关样本检验,同一受试对象测试2个或多个观测值,数据不再相互独立,而是彼此相关。例 两方法测定空气中S
16、O2含量(mg/m3),如表。,SPSS检验步骤,AnalyzeNonparametric Tests2 Related Samples将两个实验变量同时进入“Test pair list”在“Test Type”中选择一种方法(默认第一种)OK,Wilcoxon法检验不能认为两法测定的二氧化硫含量有差异。,(4)多个相关样本检验,例 患者四个阶段的血清GPT值如表,有无差异?注意:本例四组均服从正态分布,应首选多个配对样本的T检验。此处用以演示“不服从正态分布时的多个相关样本的非 参数检验”方法。,SPSS检验步骤,AnalyzeNonparametric Testsk Related Sa
17、mples将所有实验变量同时进入“Test for Serveral Related Samples”在“Test Type”中选择一种方法(默认第一种)OK,结论:Friedman方法 x2=16.714,df=3,P=0.001,故认为治疗四阶段GTP差异有显著性。,3 简单线性相关与回归,医学研究中经常要研究两个变量的关系问题,如年龄与体重,血压与病死率等。在弄清两个变量关系之后,可以从一个变量的数值去估计另一个变量的数值,例如可根据前人研究“体重(Kg)=年龄(周岁)2+8”对体重做出估计,从而省去测量体重的麻烦。,三、计量资料常用统计分析,简单线性相关,应用条件 1 X、Y双变量均为正态分布的资料。2 相关的变量应有内在联系。如年龄与体重,年龄与 身高有内在联系;而儿童身高与树高是伴随关系,变量“时间”与身高及树高的潜在联系造成了身高与 树高似有正相关关系的假象。3 奇异值应剔除。4 P0.05时,r 无意义。P0.05,如果r过小,相关 程度较低,例如r=0.20,r2=0.04,说明因变量中只有 4%的量与自变量相关。,例,
链接地址:https://www.31ppt.com/p-5449273.html