统计描述和推论.ppt
《统计描述和推论.ppt》由会员分享,可在线阅读,更多相关《统计描述和推论.ppt(135页珍藏版)》请在三一办公上搜索。
1、Chapter Three central tendency算术平均数中数百分位数众数加权平均数几何平均数调和平均数,算术平均数(average):未归表的原始数据计算算术平均数:8、2、5、3、7已归表的原始数据计算算术平均数,中数(Median):位于一组按大小顺序排列的数据中间位置上的数据。未归表的原始数据计算算术平均数:中数=(N+1)/2数据个数为奇数与偶数的情形数据个数为奇数与偶数时有重复数据的情形1,9,5,5,5,7,1,9,5,5,5,7,4 4.5-5.5 已归表的原始数据计算算术平均数,百分位数(Percentiles):位于依一定顺序排列的一组数据中某一百分位置的数据。
2、,众数(Mode):一组数据中出现次数最多的那个数。用观察法计算用公式计算:插补法,加权平均数(weighted mean),有时也可称为总体平均数,是几个样本的平均数组成的总体的平均数。,几何平均数(GEOMEAN):当一个数列的后一个数据是以前一个数据为基础成比率增长时,可用集合平均数求平均增长速度。,调和平均数(HARMEAN):主要用于求学习速度,Chapter Four Measures of Variation全距(Range)四分位差(Quartile)百分位距(Percent Rank)平均差(AD)方差和标准差(Variance&SD)汇合标准差或总体标准差(ST)偏态量(S
3、kew)峰态量(Kurt)相对标准差(CV)标准差(Z),全距(Range)四分位差(Quartile)百分位距(Percent Rank),1、5、8、12、13、16、19、28、30;50、51、59、65、66、79、82、90;,平均差(ADaverage deviation,or MDmedian deviation):未归表数据求平均差;已归表数据求平均差。,MD,方差和标准差(variance and standard deviation):未归表数据求方差和标准差已归表数据求方差和标准差,汇合标准差或总体标准差,标准分数(Z):以标准为单位,标志某一分数离开团体均数的距离:,
4、相对差异量(relative deviation):该值一般在5%-35%之间。,偏态量(Skew):当N200以上时,计算的偏态系数才是可靠的。SK0为正偏态,SK0为负偏态,SK=0 为正态。,Y,X,O,Y,X,O,峰态量(kurt):Ku以0.263为判断值,小于为高狭峰,大于为低阔峰;u以0为判断标准,大于0为高狭峰,小于0为低阔峰。,Y,X,O,Y,X,O,练习与思考题P71-72:作业:2、5、6、7、8、11其它:练习,单元总结:1.心理与教育统计学研究的主要内容有哪些?2.为什么要学习心理与教育统计学?3.次数分布表的制作分为哪几步?4.解释下列概念:随机变量 样本 统计量
5、参数 随机现象5.什么是集中量?包含哪些计算指标?6.当一组数据呈正态分布时,中枢、均数与众数之间具有怎样的关系?7.请分别写出下列统计量的基本计算公式:均数 加权平均数 8.请分别写出下列统计量的基本计算公式:平均差 标准差 标准分数 偏态量 峰态量,9.什么是四分位距?如何计算?10.什么是百分位距?百分等级?两者之间是什么关系?11.当一组数据呈正态分布时,全距、平均差、四分位距与标准差之间具有怎样的关系?12.差异量的作用是什么?,Chapter Five Probability and Distribution概率的含义二项分布正态分布,描述统计与推论统计的关系:前面介绍的统计方法是
6、对研究所获资料进行一般性描述,但科学研究的任务更重要的是根据所获资料去推论由其所代表的总体的一般性情况。由于研究中所获数据多为随机数据或随机变量,因此,根据随机变量去推论由它们所构成的总体,就要依赖描述随机变量规律性变化的理论即概率论为基础。概率的含义:后验概率:在对随机现象进行N次观察时,组成该随机现象的随机事件之一随机事件A出现的次数为M次,随着观测次数的不断增加,随机事件A发生的可能性逐渐稳定在M/N附近,该值就被用来描述随机事件A在该随机现象中有规律地出现的可能性大小,即随机事件A发生的概率,表示为:,先验概率或古典概率:指对满足下列条件的随机事件发生可能性的描述,如掷色子或抛硬币:试
7、验的每一种可能结果(称为基本事件)是有限的;每一个基本事件出现的可能性相等;概率的性质:公理性质:任何一个随机事件都是非负的;必然事件的概率为1;不可能事件的概率为0;加法定理:两个互不相容的事件之和的概率为两个事件概率之和。互不相容的事件指在一次观测中不能同时发生的事件。,公式表示为:可推广为:,举例:凭猜测回答2道是非题,答对1题的可能性有多大?至少答对1题的可能性有多大?全猜对的可能性多大?1/4 1/4 1/4 1/4,乘法定理:两个独立事件同时发生的概率等于这两个事件各自出现概率的乘积。独立事件指一个事件的出现对另一个事件的出现不发生影响。公式表示为:,举例:甲射手击中目标的概率为0
8、.9,乙射手击中目标的概率为0.8,问甲乙两人同时击中目标的概率为多少?击中目标的概率为多少?,概率分布:指用数学方法(函数)对随机变量取值的分布情况加以描述。概率分布的类型:离散分布与连续分布离散分布:随机变量取孤立的值时的概率分布,如二项分布;连续分布:连续随机变量的概率分布;如正态分布经验分布与理论分布:经验分布:根据观察或实验所获得的饿数据而编制的次数分布或相对频率分布;理论分布:一指随机变量概率分布的函数数学模型;二指按某种数学模型计算出的总体次数分布;,基本随机变量分布与抽样分布:基本随机变量分布:理论分布中描述构成总体的基本变量的分布;抽样分布:样本统计量的理论分布;样本统计量如
9、平均数、两平均数之差、方差、标准差、相关系数、回归系数、百分比率等等是基本随机变量的函数,即统计量是由基本随机变量计算而来的,故抽样分布又称为基本随机变量函数的分布。,二项分布:二项分布试验:指满足下列条件的试验:一次试验只有两种可能结果,即成功或失败;各次试验相互独立,即各次试验之间互不影响;各次试验中成功的概率或失败的概率相等二项分布函数:含义:描述在N次试验中成功事件出现不同次数的概率分布。表达式:,二项分布表达式的由来:以抛硬币为例:抛3次硬币,出现的可能结果分布如下(p代表正面,q代表反面):ppp,ppq,pqq,qqq,qqp,qpp,pqp,qpq 出现的结果可分成四类,即:p
10、3、3 p2 p1、3p1 p2、p3,它们恰好是根据二项式定理对(p+q)3进行推导的展开式,若进行N次观察,则出现的各种可能结果就可用二项式定理(p+q)n的展开式加以对应描述,二项展开式的各项系数也可用杨辉三角直接求出。二项分布图的性质:当P=Q时,不管N多大,呈对称分布;当N 很大时,接近正态分布;当P不等于Q且N较小时,图形呈偏态:偏的方向取决于P与Q相比睡大睡小,二项分布图的平均数与标准差:当其接近正态分布时:平均数:标准差:二项分布的应用:用来判断成功事件出现的概率;判断试验结果的机遇性与真实性的界限。如回答10道四择一的选择题,如何判断学生的回答是真实的而非猜测?练习与作业P9
11、6-97:1-5,正态分布:连续性随机变量的概率分布正态分布的函数或写成标准正态分布的形式:,当样本均数等于总体均数时,可写成:当标准差为1时,即Y的最大值为0.3989,曲线为频数(频率)曲线,略呈钟型,两头低,中间高,左右对称,近似数学上的正态曲线(normal curve),故称这种分布为正态分布(normal distribution)。,正态分布曲线的性质:以过平均数的点为轴,两侧对称,均数、中数、众数三者相等,此点Y至最大,左右相当的饿间距面积相等;中央点最高向两侧下降,先里后外,拐点位于正负一个标准差处,曲线两端无限延伸,但最终不与基线相交;正态曲线下的面积为,以平均数为界,左右
12、各占0.5,每一横坐标的值是其所对应面积与总面积的比值,是其所代表的随机变量的出现概率;正态分布的形态取决于平均数和标准差;正态部分中各差异量的值 都有固定的比率(见P155);正态分布中的标准差与概率之间具有一定的数量关系:即正负一个标准差包含68.26%的面积;正负一个标准差包含95%的面积;正负一个标准差包含99%的面积。依标准分数性质,标准正态分布均数为0,标准差为1,正态分布曲线表的编制与使用:正态曲线下各对应的横坐标处与平均数之间的面积即个体概率及密度函数值(Y值)可根据Z值 的变化用积分公式加以计算(如下式),公式中的为X轴上无限小的区间。由于不同的编制者,有的从Z为无限小开始计
13、算,有的Z=0开始计算,所制作的正态分布曲线表也就不同。,正态分布曲线表的使用:依据Z分数求概率P;某分数与平均数之间的概率;如Z72=0.8求Z分数以上或以下的概率;求两个分数之间的概率;从概率P求Z分数;已知从平均数开始的概率值,求Z值;求两端的概率值;若已知正态曲线下中央部分的概率,Z分数求概率密度Y,正态分布理论在测验上的应用:化等级评定为测量数据;在能力评定或等级分组时确定人数;确定录取线;确定测验题目的难易程度:化百分数为Z分数化原始分数为标准分数(Z或T)练习与作业(P96-98),3名教师对50位学生的等级总评定,3名教师对三位学生的等级评定,三名教师各自等级的Z分数:甲 乙
14、丙 丁A 1.64 0.52-0.52-1.64B 1.28 0.39-0.39-1.28C 1.04 0-0.84-1.64三位同学获得的Z分数 a=0.67 b=0.65 c=0.043,Chapter Six sample distribution and inference of population parameters抽样分布总体平均数的估计总体比率的估计假设检验的基本原理总体平均数的显著性检验,抽样分布,135 134 129 133 131 131 131 134 125 128 135 127 127 133 130 132 132 129 124 132 122 124 1
15、27 131 137 132 133 134 124 128 135 133 131 123 115 132 134 138 124 132 128 136 127 120 125 131 136 127 124 129 129 132 138 125 131 120 121 144 128 133 128 127 130 120 121 122 127 121 125 130 140 121 126 130 122 128 127 125 127 131,容量=80 平均数=128.913 标准差=5.223,总体分布:总体内个体数值的频率分布;,1351341291331311311311
16、34124132122124127131137132134138124132128136127120131120121144128133128127126130122128127125127131135127127133130132132129,容量=48 平均数=129.5625 标准差=4.8942,样本分布:样本内个体数值的频数分布;,所抽取的各样本的平均数如下:,容量=50 平均数=129.303 标准差=0.878,所抽取的各样本平均数次数分布表:,请求出每个可能的样本平均数对应的Z分数,根据抽样平均数频率分布表制作的多边图,抽样分布抽样分布的含义总体分布:总体内个体数值的频率分布;
17、样本分布:样本内个体数值的频数分布;抽样分布:某一种统计量的频率分布。平均数样本的几个定理:从总体中随机抽出容量为N的一切可能样本的平均数之平均数等于总体的平均数;,容量为N的平均数在抽样分布上的标准差,等于总体标准差除以N的平方根从正态总体中,随机抽取的容量为N的一切可能样本平均数的分布也呈正态分布;虽然总体不呈正态分布,如果样本容量较大,反映总体u和的样本平均数的抽样分布,也接近于正态分布;,标准误的含义:某种统计量在抽样分布上的标准差。平均数抽样分布的标准误;标准差抽样分布的标准误;相关抽样分布的标准差;样本平均数与总体平均数离差统计量的形态:当总体方差已知时,,当总体方差未知时(多数情
18、况下是这样),一切可能样本平均数与总体平均数的离差统计量呈t分布。,关于t分布:关于Z分布与T分布的区别:当总体方差已知时,Z只随样本平均数而变化;当总体方差未知时,T不仅随样本平均数而变化,而且还随S而变化。T分布的特点:T分布的形态随自由度的变化呈一簇分布形态(即自由度不同的T分布形态也不同);T分布的峰狭窄尖峭,尾长而翘得高;自由度越小,分布范围越广;自由度趋于无限大时,T分布接近正态分布;自由度df:指总体参数估计量中变量值自由变化的个数。,总体平均数估计的原理含义:根据样本统计量对相应总体参数所做的估计。基本原理:点估计:含义:用某一样本的统计量估计相应的总体参数标准:无偏性;有效性
19、;一致性.充分性:容量为N的统计量是否 反映了全部N个数据所反映的总体信息。,区间估计:以样本统计量的抽样分布为理论依据,按一定概率要求,由样本统计量的值估计总体参数值的所在范围,称为总体参数的区间估计。总体平均数的估计:从正态总体中随机抽取容量为N的一切可能样本的平均数的抽样分布,是以总体平均数为中心的正态分布。当总体标准差已知时,一切可能样本平均数的标准记分呈标准正态分布。若以样本平均数对总体平均数的饿估计要求达到95%的可靠度,即是使Z在-1.96-+1.96之间变动,其间的面积为95%。也就是说,当从样本平均数出发估计总体平均数时,总体平均数的有95%可能性会在Z=-1.96-+1.9
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 描述 推论
链接地址:https://www.31ppt.com/p-5299746.html