用Excel做统计学分析.ppt
用Excel做统计学分析,一.反应数据变异程度大小的概念二.假设性检验三.一元线性回归,一.反映数据变异程度大小的概念,极差(range):亦称全距,即最大值与最小值之差四分位间距(inter-quartile range):第3 四分位数(Q3=P75)和第1 四分位数(Q1=P25)相减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,比极差稳定。偏差:随机变量的取值与均值的差方差(variance):反映一组数据的平均离散水平:,一.反映数据变异程度大小的指标,标准差(standard deviation):方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,最为常用,一.反映数据变异程度大小的指标,变异系数(coefficient of variation):用于观察指标单位不同或均数相差较大时两组资料变异程度的比较,正态分布,正态分布:若指标X 的频率曲线对应于数学上的正态曲线,则称该指标服从正态分布(normal distribution)。通常用记号N(,)表示均数为,标准差为的正态分布。,置信区间,可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。该范围称为总体参数的可信区间(confidence interval,CI)。它的确切含义是:可信区间包含总体参数的可能性是1-,而不是总体参数落在该范围的可能性为1-。当a=0.05时,称为95%可信区间,记作95%CI。当a=0.01时,称为99%可信区间,记作99%CI。,二.假设性检验,假设检验(Test of hypothesis)假设检验亦称“显著性检验(Test of statistical significance)”,是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。主要包括T检验,F检验,Z检验,方差分析,假设性检验的步骤,1.建立假设,确定检验水准 零假设(H0)和备择假设(H1)2.根据研究目的和设计类型选择适合的检验方法 主要包括T检验,F检验,Z检验,方差分析 3.确定P值并作出统计结论,方差分析,方差分析(analysis of variance,ANOVA)英国统计学家首先提出的,所以又叫F检验应用条件:各样本须是相互独立的随机样本;各样本来自正态分布总体;各总体方差相等,即方差齐。用途:两个或多个样本均数间的比较;分析两个或多个因素间的交互作用;回归方程的线性假设检验;多元线性回归分析中偏回归系数的假设检验;两样本的方差齐性检验等。,Excel中的方差分析,单因素方差分析(one-way ANOVA)可重复双因素方差分析 无重复双因素方差分析,方差分析的步骤,1.建立零假设H0:样本均数都相同即1=2=3=m=,m个样本有共同的方差。则m个样本来自具有共同的方差 和相同的均数u的总体。2.选择方差分析方式及计算公式 3.根据P值得出结论:(MS间MS内),FF0.05(df间,df内),p0.05,拒绝零假设,说明样本来自不同的正态总体,说明处理造成均值的差异有统计意义,单因素方差分析,是用来研究一个控制变量的不同水平是否对观测变量产生了显著影响。步骤:1.明确控制变量和观测变量2.剖析控制变量的方差分析,总的离差平方和分解为组间和组内两部分3.通过比较观测变量总离差平方和各部分所占的比例,推断,离差平方和计算公式,如果组间离差平方和所占比例较大,则说明观测变量的变动主要是由控制变量引起的,可以主要由控制变量来解释,控制变量给观测变量带来了显著影响,方差分析表,F检验方差齐性分析,方差齐性分析若两总体方差相等,则直接用t检验,若不等,可采用t检验或变量变换或秩和检验等方法。,T检验,T检验 对两样本均数(mean)差别的显著性进行检验 用于小样本(样本容量小于30),T检验分类,单样本t检验:是用样本均数代表的未知总体均数和已知总体均数进行比较。配对t检验:是采用配对设计方法观察以下情形,1,两个同质受试对象分别接受两种不同的处理;2,同一受试对象接受两种不同的处理;3,同一受试对象处理前后。两样本t检验:从两研究总体中随机抽取样本,要对这两个样本进行比较的时候,首先要判断两总体方差是否相同,即方差齐性。若两总体方差相等,则直接用t检验,若不等,可采用t检验或变量变换或秩和检验等方法。其中要判断两总体方差是否相等,就可以用F检验。,T检验步骤,1.建立零假设H0:1=2;2.计算统计量T值,对于不同类型的问题选用不同的统计量计算方法;3.根据自由度df=n-1,查T值表,找出规定的T理论值并进行比较;结合P值,做出结论。,Z检验,Z检验一般用于大样本(即样本容量大于30)平均值差异性检验的方法.,三.一元线性回归,回归关系的显著性检验-F检验,1.零假设:,2.F值计算:,3.P值及结论:判断线性回归方程是否显著,是否有意义。,决定系数(r2):表示回归方差估测可靠程度的高低相关系数(r):表示y与x直线相关的密切程度,回归系数的t检验,1.零假设H0:=0 即Y的变化与X无关;H1:0。2.t值计算:3.结论:回归系数是否有意义;对应的自变量是否有意义。,截距的t检验,1.零假设H0:=0 H1:02.T值计算:3.结论:看截距是否有意义,