统计描述和推论.ppt
Chapter Three central tendency算术平均数中数百分位数众数加权平均数几何平均数调和平均数,算术平均数(average):未归表的原始数据计算算术平均数:8、2、5、3、7已归表的原始数据计算算术平均数,中数(Median):位于一组按大小顺序排列的数据中间位置上的数据。未归表的原始数据计算算术平均数:中数=(N+1)/2数据个数为奇数与偶数的情形数据个数为奇数与偶数时有重复数据的情形1,9,5,5,5,7,1,9,5,5,5,7,4 4.5-5.5 已归表的原始数据计算算术平均数,百分位数(Percentiles):位于依一定顺序排列的一组数据中某一百分位置的数据。,众数(Mode):一组数据中出现次数最多的那个数。用观察法计算用公式计算:插补法,加权平均数(weighted mean),有时也可称为总体平均数,是几个样本的平均数组成的总体的平均数。,几何平均数(GEOMEAN):当一个数列的后一个数据是以前一个数据为基础成比率增长时,可用集合平均数求平均增长速度。,调和平均数(HARMEAN):主要用于求学习速度,Chapter Four Measures of Variation全距(Range)四分位差(Quartile)百分位距(Percent Rank)平均差(AD)方差和标准差(Variance&SD)汇合标准差或总体标准差(ST)偏态量(Skew)峰态量(Kurt)相对标准差(CV)标准差(Z),全距(Range)四分位差(Quartile)百分位距(Percent Rank),1、5、8、12、13、16、19、28、30;50、51、59、65、66、79、82、90;,平均差(ADaverage deviation,or MDmedian deviation):未归表数据求平均差;已归表数据求平均差。,MD,方差和标准差(variance and standard deviation):未归表数据求方差和标准差已归表数据求方差和标准差,汇合标准差或总体标准差,标准分数(Z):以标准为单位,标志某一分数离开团体均数的距离:,相对差异量(relative deviation):该值一般在5%-35%之间。,偏态量(Skew):当N200以上时,计算的偏态系数才是可靠的。SK0为正偏态,SK0为负偏态,SK=0 为正态。,Y,X,O,Y,X,O,峰态量(kurt):Ku以0.263为判断值,小于为高狭峰,大于为低阔峰;u以0为判断标准,大于0为高狭峰,小于0为低阔峰。,Y,X,O,Y,X,O,练习与思考题P71-72:作业:2、5、6、7、8、11其它:练习,单元总结:1.心理与教育统计学研究的主要内容有哪些?2.为什么要学习心理与教育统计学?3.次数分布表的制作分为哪几步?4.解释下列概念:随机变量 样本 统计量 参数 随机现象5.什么是集中量?包含哪些计算指标?6.当一组数据呈正态分布时,中枢、均数与众数之间具有怎样的关系?7.请分别写出下列统计量的基本计算公式:均数 加权平均数 8.请分别写出下列统计量的基本计算公式:平均差 标准差 标准分数 偏态量 峰态量,9.什么是四分位距?如何计算?10.什么是百分位距?百分等级?两者之间是什么关系?11.当一组数据呈正态分布时,全距、平均差、四分位距与标准差之间具有怎样的关系?12.差异量的作用是什么?,Chapter Five Probability and Distribution概率的含义二项分布正态分布,描述统计与推论统计的关系:前面介绍的统计方法是对研究所获资料进行一般性描述,但科学研究的任务更重要的是根据所获资料去推论由其所代表的总体的一般性情况。由于研究中所获数据多为随机数据或随机变量,因此,根据随机变量去推论由它们所构成的总体,就要依赖描述随机变量规律性变化的理论即概率论为基础。概率的含义:后验概率:在对随机现象进行N次观察时,组成该随机现象的随机事件之一随机事件A出现的次数为M次,随着观测次数的不断增加,随机事件A发生的可能性逐渐稳定在M/N附近,该值就被用来描述随机事件A在该随机现象中有规律地出现的可能性大小,即随机事件A发生的概率,表示为:,先验概率或古典概率:指对满足下列条件的随机事件发生可能性的描述,如掷色子或抛硬币:试验的每一种可能结果(称为基本事件)是有限的;每一个基本事件出现的可能性相等;概率的性质:公理性质:任何一个随机事件都是非负的;必然事件的概率为1;不可能事件的概率为0;加法定理:两个互不相容的事件之和的概率为两个事件概率之和。互不相容的事件指在一次观测中不能同时发生的事件。,公式表示为:可推广为:,举例:凭猜测回答2道是非题,答对1题的可能性有多大?至少答对1题的可能性有多大?全猜对的可能性多大?1/4 1/4 1/4 1/4,乘法定理:两个独立事件同时发生的概率等于这两个事件各自出现概率的乘积。独立事件指一个事件的出现对另一个事件的出现不发生影响。公式表示为:,举例:甲射手击中目标的概率为0.9,乙射手击中目标的概率为0.8,问甲乙两人同时击中目标的概率为多少?击中目标的概率为多少?,概率分布:指用数学方法(函数)对随机变量取值的分布情况加以描述。概率分布的类型:离散分布与连续分布离散分布:随机变量取孤立的值时的概率分布,如二项分布;连续分布:连续随机变量的概率分布;如正态分布经验分布与理论分布:经验分布:根据观察或实验所获得的饿数据而编制的次数分布或相对频率分布;理论分布:一指随机变量概率分布的函数数学模型;二指按某种数学模型计算出的总体次数分布;,基本随机变量分布与抽样分布:基本随机变量分布:理论分布中描述构成总体的基本变量的分布;抽样分布:样本统计量的理论分布;样本统计量如平均数、两平均数之差、方差、标准差、相关系数、回归系数、百分比率等等是基本随机变量的函数,即统计量是由基本随机变量计算而来的,故抽样分布又称为基本随机变量函数的分布。,二项分布:二项分布试验:指满足下列条件的试验:一次试验只有两种可能结果,即成功或失败;各次试验相互独立,即各次试验之间互不影响;各次试验中成功的概率或失败的概率相等二项分布函数:含义:描述在N次试验中成功事件出现不同次数的概率分布。表达式:,二项分布表达式的由来:以抛硬币为例:抛3次硬币,出现的可能结果分布如下(p代表正面,q代表反面):ppp,ppq,pqq,qqq,qqp,qpp,pqp,qpq 出现的结果可分成四类,即:p3、3 p2 p1、3p1 p2、p3,它们恰好是根据二项式定理对(p+q)3进行推导的展开式,若进行N次观察,则出现的各种可能结果就可用二项式定理(p+q)n的展开式加以对应描述,二项展开式的各项系数也可用杨辉三角直接求出。二项分布图的性质:当P=Q时,不管N多大,呈对称分布;当N 很大时,接近正态分布;当P不等于Q且N较小时,图形呈偏态:偏的方向取决于P与Q相比睡大睡小,二项分布图的平均数与标准差:当其接近正态分布时:平均数:标准差:二项分布的应用:用来判断成功事件出现的概率;判断试验结果的机遇性与真实性的界限。如回答10道四择一的选择题,如何判断学生的回答是真实的而非猜测?练习与作业P96-97:1-5,正态分布:连续性随机变量的概率分布正态分布的函数或写成标准正态分布的形式:,当样本均数等于总体均数时,可写成:当标准差为1时,即Y的最大值为0.3989,曲线为频数(频率)曲线,略呈钟型,两头低,中间高,左右对称,近似数学上的正态曲线(normal curve),故称这种分布为正态分布(normal distribution)。,正态分布曲线的性质:以过平均数的点为轴,两侧对称,均数、中数、众数三者相等,此点Y至最大,左右相当的饿间距面积相等;中央点最高向两侧下降,先里后外,拐点位于正负一个标准差处,曲线两端无限延伸,但最终不与基线相交;正态曲线下的面积为,以平均数为界,左右各占0.5,每一横坐标的值是其所对应面积与总面积的比值,是其所代表的随机变量的出现概率;正态分布的形态取决于平均数和标准差;正态部分中各差异量的值 都有固定的比率(见P155);正态分布中的标准差与概率之间具有一定的数量关系:即正负一个标准差包含68.26%的面积;正负一个标准差包含95%的面积;正负一个标准差包含99%的面积。依标准分数性质,标准正态分布均数为0,标准差为1,正态分布曲线表的编制与使用:正态曲线下各对应的横坐标处与平均数之间的面积即个体概率及密度函数值(Y值)可根据Z值 的变化用积分公式加以计算(如下式),公式中的为X轴上无限小的区间。由于不同的编制者,有的从Z为无限小开始计算,有的Z=0开始计算,所制作的正态分布曲线表也就不同。,正态分布曲线表的使用:依据Z分数求概率P;某分数与平均数之间的概率;如Z72=0.8求Z分数以上或以下的概率;求两个分数之间的概率;从概率P求Z分数;已知从平均数开始的概率值,求Z值;求两端的概率值;若已知正态曲线下中央部分的概率,Z分数求概率密度Y,正态分布理论在测验上的应用:化等级评定为测量数据;在能力评定或等级分组时确定人数;确定录取线;确定测验题目的难易程度:化百分数为Z分数化原始分数为标准分数(Z或T)练习与作业(P96-98),3名教师对50位学生的等级总评定,3名教师对三位学生的等级评定,三名教师各自等级的Z分数:甲 乙 丙 丁A 1.64 0.52-0.52-1.64B 1.28 0.39-0.39-1.28C 1.04 0-0.84-1.64三位同学获得的Z分数 a=0.67 b=0.65 c=0.043,Chapter Six sample distribution and inference of population parameters抽样分布总体平均数的估计总体比率的估计假设检验的基本原理总体平均数的显著性检验,抽样分布,135 134 129 133 131 131 131 134 125 128 135 127 127 133 130 132 132 129 124 132 122 124 127 131 137 132 133 134 124 128 135 133 131 123 115 132 134 138 124 132 128 136 127 120 125 131 136 127 124 129 129 132 138 125 131 120 121 144 128 133 128 127 130 120 121 122 127 121 125 130 140 121 126 130 122 128 127 125 127 131,容量=80 平均数=128.913 标准差=5.223,总体分布:总体内个体数值的频率分布;,135134129133131131131134124132122124127131137132134138124132128136127120131120121144128133128127126130122128127125127131135127127133130132132129,容量=48 平均数=129.5625 标准差=4.8942,样本分布:样本内个体数值的频数分布;,所抽取的各样本的平均数如下:,容量=50 平均数=129.303 标准差=0.878,所抽取的各样本平均数次数分布表:,请求出每个可能的样本平均数对应的Z分数,根据抽样平均数频率分布表制作的多边图,抽样分布抽样分布的含义总体分布:总体内个体数值的频率分布;样本分布:样本内个体数值的频数分布;抽样分布:某一种统计量的频率分布。平均数样本的几个定理:从总体中随机抽出容量为N的一切可能样本的平均数之平均数等于总体的平均数;,容量为N的平均数在抽样分布上的标准差,等于总体标准差除以N的平方根从正态总体中,随机抽取的容量为N的一切可能样本平均数的分布也呈正态分布;虽然总体不呈正态分布,如果样本容量较大,反映总体u和的样本平均数的抽样分布,也接近于正态分布;,标准误的含义:某种统计量在抽样分布上的标准差。平均数抽样分布的标准误;标准差抽样分布的标准误;相关抽样分布的标准差;样本平均数与总体平均数离差统计量的形态:当总体方差已知时,,当总体方差未知时(多数情况下是这样),一切可能样本平均数与总体平均数的离差统计量呈t分布。,关于t分布:关于Z分布与T分布的区别:当总体方差已知时,Z只随样本平均数而变化;当总体方差未知时,T不仅随样本平均数而变化,而且还随S而变化。T分布的特点:T分布的形态随自由度的变化呈一簇分布形态(即自由度不同的T分布形态也不同);T分布的峰狭窄尖峭,尾长而翘得高;自由度越小,分布范围越广;自由度趋于无限大时,T分布接近正态分布;自由度df:指总体参数估计量中变量值自由变化的个数。,总体平均数估计的原理含义:根据样本统计量对相应总体参数所做的估计。基本原理:点估计:含义:用某一样本的统计量估计相应的总体参数标准:无偏性;有效性;一致性.充分性:容量为N的统计量是否 反映了全部N个数据所反映的总体信息。,区间估计:以样本统计量的抽样分布为理论依据,按一定概率要求,由样本统计量的值估计总体参数值的所在范围,称为总体参数的区间估计。总体平均数的估计:从正态总体中随机抽取容量为N的一切可能样本的平均数的抽样分布,是以总体平均数为中心的正态分布。当总体标准差已知时,一切可能样本平均数的标准记分呈标准正态分布。若以样本平均数对总体平均数的饿估计要求达到95%的可靠度,即是使Z在-1.96-+1.96之间变动,其间的面积为95%。也就是说,当从样本平均数出发估计总体平均数时,总体平均数的有95%可能性会在Z=-1.96-+1.96的范围内。换句话说,总体平均数在Z=-1.96-+1.96之间出现的可能性为95%。,区间估计原理与标准误:区间高压脊是根据样本分布理论,用样本分布的标准误计算区间长度,解释总体参数落入某置信区间可能的概率;只有知道了样本分布的规律和样本统计量分布的标准误,才能计算总体参数可能落入的区间长度,才能对区间估计的概率进行解释。样本分布可提供概率解释,标准误的大小决定区间估计的长度,标准误越小,置信区间的长度越短,而估计成功的概率仍能保持较高。一般地,加大样本容量可使标准误变小。在对总体参数实际进行估计中,人们当然希望估计值的范围尽可能小些,而估计准确的概率大些。但在样本容量一定的情况下,二着不可兼得。,相关概念:置信度:根据样本统计量估计总体参数时,总体参数不出现在一定区域范围的可能性,又称为显著性水平。(0.05Z*、0.01 Z*、0.001 Z*)置信区间:一定条件下根据样本统计量估计总体参数时,总体参数可能出现的区域范围;单尾(左、右侧)与双尾检验:区间估计的具体步骤:确定样本平均数的分布形态Z或T计算样本分布的标准误查表确定置信度计算一定置信度前提下的置信区间,总体平均数的估计:总体标准差已知条件下的估计:例题:某小学全体女生身高历年来的标准差为6.25厘米。现从该学校随机抽27名10岁女生,测得平均身高134.2厘米,试在95%和99%的置信度下估计该学校10岁女生平均身高的可能范围。,总体标准差未知条件下的估计:小样本:标准误根据总体标准差以N-1计算大样本:标准误根据样本标准差当作Z分布计算例题一:从该学校随机抽40名10岁女生,测得平均身高134.2厘米,标准差为7.5厘米,试在95%和99%的置信度下估计该学校10岁女生平均身高的可能范围。,例题二:从某小学三年级随机抽12名学生,测得其阅读能力得分分别为28,32,36,22,34,30,33,25,31,33,29,26。试在95%和99%的置信度下估计该学校三年级学生平均阅读能力的可能范围。,练习:,总体比率的估计:适用的数据特点:间断变量的数据或比率;连续变量的数据按一定标准被划分为不同类型;统计推断方法:总体比率推断;X2检验;总体比率估计的原理:分布形态的确定:比率的抽样分布为二项分布。其推断依据为:从一个二项分布的总体中随机抽取容量为N的样本,计算出成功事件出现的概率后,将之还回总体中去,再从中抽取容,量为N的样本,再次计算成功事件出现的概率,如此反复抽取,就可以获得一切可能的样本,将这一切可能样本的P值进行频数分布,就形成一个实验性的比率的抽样分布。根据二项概率分布理论就可进行总体比率的推断。二项概率分布的主要理论 包括(1)当p=q,无论N的大小,二项分布呈对称分布;(2)当p=5时,或pq且nq=5,二项分布开始接近正态。标准误的计算:当总体比率已知时的标准误计算,当总体比率未知时的标准误计算(用样本比率作为总体比率的估计值,因此其标准误该为如下)例题:用样本比率估计总体比率的标准误的计算,总体比率的区间估计:含义:根据一定概率要求,估计总体比率所在范围。计算方法:正态近似法:确定分布形态:根据二项概率分布的理论判断;计算总体比率估计的标准误;计算统计量;,计算置信区间:,查表法(P在0或1附近,或样本容量较小时):见附表6,范围为:1n 1000,P 1%;获得试验的次数n和成功事件出现的绝对频数x;表的行为x,列为n,对应的每个数据点的上行左右分别为95%的上下限,下行左右分别为99%的上下限;N为大数字情况下,由于表中没有具体的精确值,需采用内插法计算(P199)例题:,假设检验的基本原理:假设检验的含义:利用样本信息,根据一定概率,对总体参数或分布的某一假设作出拒绝或保留的决断,称为假设检验。实际上是对样本平均数与总体平均数之间是否存在显著差异进行检验。原理(以总体参数的假设检验为例):当对某一总体参数进行假设检验时,首先从该总体中随机抽取一个样本,计算出该样本统计量的值,并根据经验对相应总体参数提出一个假设,即:这个样本的统计量是这个假设总体参数值的一个随机样本,也就是说,这个样本是来自这个总体,而样本统计量的值与总体参数值之间的差异是抽样误差所致。根据这一假设可以认为,像这样的一切可能样本统计量的值应当以总体参数为中心形成该种统计量的一个抽样分布,如果这个随机样本统计量的值在其抽样分布上出现的概率较大,则保留这个,假设,即承认该样本来自这个总体,而样本统计量的值与总体参数的差异是抽样误差所致,如果这个随机样本统计量的值在其抽样分布上出现的概率极小,根据小概率事件在一次抽样中几乎不可能发生,则否定这个样本统计量是来自这个总体参数值的假设,也就是说,样本统计量的值与总体参数之间的差异不是抽样误差所致,而是存在着本质差异,故称它们之间差异显著。假设:虚无假设H0:样本均值与总体均值无显著差异备选假设H1:样本均值与总体均值存在显著差异小概率事件:出现概率极小的随机事件。在随机抽样的条件下,小概率事件几乎是不可能发生的。显著性水平:小概率事件的判断标准,如5%,1%,显著性水平与虚无假设的关系:虚无假设是否成立,是以由显著性水平所确立的小概率事件的判断标准为前提的:当把概率越小的随机事件确定为小概率事件,虚无假设成立的可能性就越大,反之,虚无假设被拒绝的可能性就越大。推断时容易发生的两类错误:类型一错误():根据统计推断结果否定虚无假设,而实际上虚无假设是成立的;类型二错误():根据统计推断结果接受虚无假设,而实际上虚无假设不成立。控制两种类型错误产生的方法:对类型一错误,可以根据研究者对错误后果的估计加以控制;,在保持类型一可能的错误率一定情况下,利用已知的实际总体参数值与假设参数值之间大小关系,合理安排拒绝区域的位置:当不能预料总体平均数的值与假设的总体平均数的值之间的关系时,可采用双侧检验;当已知总体平均数的值大于假设的值时,采用右侧检验;当已知总体平均数的值小于假设的值时,采用左侧检验;使样本容量增大,可以同时减少两类错误的概率,或减少其中一种错误的概率而不增加另一种错误的概率,因为容量越大,抽样误差越小,样本分布形态越高高狭陡峭,两侧的面积越小,越使第二类错误难以出现。,总体平均数的显著性检验:具体步骤:建立假设:虚无假设:u=u0;u u0;u u0;备选假设:uu0;uu0;选择检验统计量并计算Z分布T分布确定检验形式双侧单侧进行统计推断查表寻找相应的临界值:比较Z与Z,从而确定该样本的P是否为小概率,即是否P0.05,如何确定检验形式?双侧:当根据理论或经验不能预料总体平均数的值与假设总体平均数的值之间关系时,可采用双侧检验/2;单侧:当能预料总体平均数的值大于假设的值,采用右侧检验;当能预料总体平均数的值小于假设的值,采用左侧检验。,总体标准差已知条件下总体平均数的差异检验(Z分布)具体步骤:建立假设:虚无假设:u=u0;u u0;u u0;备选假设:uu0;uu0;选择检验统计量并计算Z分布确定检验形式双侧单侧进行统计推断查表寻找相应的临界值比较Z与Z,从而确定该样本的P是否为小概率,即是否P0.05。,例题(总体标准差已知条件下总体平均数的差异检验),总体标准差未知条件下总体平均数的差异检验小样本(T分布)具体步骤:建立假设:虚无假设:u=u0;u u0;u u0;备选假设:uu0;uu0;选择检验统计量并计算T分布确定检验形式(df=n-1)双侧单侧进行统计推断查表寻找相应的临界值比较T与T,从而确定该样本的P是否为小概率,即是否P0.05。,例题(总体标准差未知条件下总体平均数的差异检验小样本),总体标准差未知条件下总体平均数的差异检验大样本(Z分布)具体步骤:建立假设:虚无假设:u=u0;u u0;u u0;备选假设:uu0;uu0;选择检验统计量并计算Z分布确定检验形式双侧单侧进行统计推断查表寻找相应的临界值比较Z与Z,从而确定该样本的P是否为小概率,即是否P0.05。,例题(总体标准差未知条件下总体平均数的差异检验-大样本),总体比率的假设检验:含义:即对样本比率与总体比率之间是否存在显著差异进行检验。方法:正态近似法:依据:(1)当p=q,无论N的大小,二项分布呈对称分布;(2)当p=5时,或pq且nq=5,二项分布开始接近正态。步骤:建立假设:虚无假设:P=P0;P P0;P P0;备选假设:PP0;PP0;,选择检验统计量并计算Z分布确定检验形式双侧单侧进行统计推断查表寻找相应的临界值比较Z与Z,从而确定该样本的P是否为小概率,即是否P0.05。例题:,查表法:条件:P在0或1附近,或样本容量较小时步骤建立假设:虚无假设:P=P0;P P0;P P0;备选假设:PP0;PP0;查表计算总体比率的临界值进行统计推断总体比率是否落在一定的置信区间,从而确定该样本的P是否为小概率,即是否P0.05。,练习与作业P12617-21;P,第七讲 平均数差异的显著性检验平均数差异的显著性检验基本原理相关样本平均数差异的显著性检验独立样本平均数差异的显著性检验方差不齐性独立样本平均数差异的显著性检验方差齐性检验,平均数差异的显著性检验基本原理:含义:检验由两个样本平均数所分别代表的相应总体平均数之间是否存在显著差异,从而判断这两个样本是否来自相同或不同的总体。简称为差异显著性检验。原理:与对样本平均数与总体平均数之间差异显著性检验原理相同,唯一区别是在判断分布形态时是根据两个样本平均数之差的抽样分布进行的,即假设以两个总体平均数之差等于零为中心的一切可能样本平均数之差的抽样概率分布。当样本平均数之差较大,以至其在抽样分布上出现的概率很小时,就意味着样本平均数之差不是来自两个总体平均数之差为零的总体,它们所来自的两个相应总体平均数之差实际上根本就不为零,这两个总体平均数之间存在本质差异。反之,当两个样本平均数之差较小时,在其抽样分布上出现的概率就较大,表明由它们所分别代表的两个总体平均数之差为零的可能性较大,换句话说,这两个总体平均数相等,它们原本就是同一个总体。,来自两个总体的样本平均数之差分布的标准误:当两个总体都为正态分布时,由分别来自两个总体的样本平均数之差组成的数据分布也呈正态。因此,对分别来自这两个总体的任意一对样本平均数之差的显著性检验实际上就是检验它们的差值在一定概率条件下是否落在分别由它们所代表的两个总体平均数之差可能分布的区域。,平均数之差的标准误:,分布形态:,两个平均数之差的标准误:含义:两个样本平均数之差的抽样误差称之为平均数之差的标准误。计算:总体方差已知时,两个相关样本平均数之差的标准误总体方差已知时,两个独立样本平均数之差的标准误,相关样本平均数差异的显著性检验相关样本的两种情况:相同组:用同一个测验对同一组被试在实验前后进行两次测验,所获得的两组结果是相关样本;配对组:根据某些条件基本相同的原理,把被试一一匹配成对,然后将每对被试随机地分入实验组和对照组,对两组被试实行不同的实验处理之后,用同一个测验所获得的测验结果,也是相关样本。检验方法:配对组情况:相同组情况:,配对组情况:建立假设:虚无假设:u1=u2(或uD=0);备选假设:u1u2(或uD 0);选择检验统计量并计算Z分布T分布确定检验形式双侧单侧进行统计推断查表寻找相应的临界值比较Z与Z,从而确定该样本的P是否为小概率,即是否P0.05。,例题:P131,相同组情况:建立假设:虚无假设:u1=u2(或uD=0);备选假设:u1u2(或uD 0);选择检验统计量并计算Z分布T分布确定检验形式双侧单侧进行统计推断查表寻找相应的临界值比较Z与Z,从而确定该样本的P是否为小概率,即是否P0.05。,例题P134,独立样本平均数差异的显著性检验含义:两个样本内的个体是随机抽取的,它们之间不存在一一对应的关系,这样的两个样本称为独立样本。独立大样本:建立假设:虚无假设:u1=u2(或uD=0);备选假设:u1u2(或uD 0);选择检验统计量并计算Z分布,进行统计推断查表寻找相应的临界值比较Z与Z,从而确定该样本的P是否为小概率,即是否P0.05。,例题:P138,独立小样本:建立假设:虚无假设:u1=u2(或uD=0);备选假设:u1u2(或uD 0);选择检验统计量并计算T分布,确定检验形式双侧单侧进行统计推断查表寻找相应的临界值比较T与T,从而确定该样本的P是否为小概率,即是否P0.05。,例题:P141,方差不齐性独立样本平均数差异的显著性检验分布形态:当总体方差不齐时,两个独立样本平均数之差与所属的总体平均数之差的离差统计量呈与T分布近似的T分布。抽样分布的标准误:近似临界值的计算,建立假设:虚无假设:u1=u2;备选假设:u1u2;选择检验统计量并计算T分布确定检验形式双侧单侧进行统计推断查表寻找相应的临界值比较T与T,从而确定该样本的P是否为小概率,即是否P0.05。,例题:P143,方差齐性检验含义:从方差相同的两个正态总体随机抽取两个独立样本,据此分别求出两个相应总体方差的估计值,其比值的抽样分布为F分布。分布形态F:F分布的特点:是一蔟偏正态分布;其比值随分子与分母中自由度的变化而变化;各种自由度形成的理论值F可查表,多用右侧检验;,自由度:df1=n1-1df2=n2-1df=n-2(相关样本,查T表)建立假设:虚无假设:备选假设:,选择检验统计量并计算F分布独立样本相关样本确定检验形式双侧单侧进行统计推断查表寻找相应的临界值比较F与F,从而确定该样本的P是否为小概率,即是否P0.05。,例题:P141,P153,作业与练习:P153-155,单元总复习描述统计:数据的初步整理统计表统计图数据的进一步整理集中量:算术平均数中数众数加权平均数,几何平均数调和平均数百分位数差异量两极差四分差百分位差平均差方差和标准差相对标准差偏态量峰态量,推论统计:概率与分布加法定理乘法定理二项分布:密度函数特点正态分布密度函数特点应用,参数估计:点估计区间估计:总体方差已知总体方差未知假设检验:总体方差已知总体方差未知独立样本相关样本,差异显著性检验独立样本相关样本方差不齐时的差异检验方差齐性检验:独立样本相关样本,