《心理统计学》总复习要点17章[4].docx
《《心理统计学》总复习要点17章[4].docx》由会员分享,可在线阅读,更多相关《《心理统计学》总复习要点17章[4].docx(52页珍藏版)》请在三一办公上搜索。
1、心理统计学总复习要点17章4心理统计学总复习要点 第一章、第二章 基本概念及次数分布表 第一节 基本概念 一、基本概念 1连续变量与离散变量(不连续变量) 变量分为连续变量与离散变量(不连续变量)。连续变量则可以在量表上的任何两点加以细分,可以取得无限多个大小不同的数值。 不连续变量又称离散变量或间断变量,则在量表上的任何两点中只能取得有限个数值。是一种只能取特殊值而不能取任何值的变量,它代表一个点,而不是一段距离。 2总体、样本、个体 总体是指具有某一种特征的一类事物的全体,构成总体的每一个基本元素称为个体,在总体中按一定规则抽取的一部分个体,称为总体的一个样本。 二、测量水平 心理测量的工
2、具一般可以分为四种水平,它们是由测量工具量尺的水平决定的,量尺也称为尺度。 量尺(Ratio Measurement) 用这样的量尺测量出的数据,可以进行加、减、乘和除运算。这种测量水平的数据特征是有相等单位和绝对零点。用这种量尺测量得到的数据变量为比率变量。 等距量尺(Interval Measurement) 只有相等单位,没有绝对零点,这种测量工具称为等距量尺。等距量尺测出的数据可以进行加和减的运算,而不能进行乘和除的运算。但是,等距数据的差值可以进行乘、除运算,因为等距数据的差值有一个绝对零点,两个数值相等,差值即为零。 用这种量尺测量得到的数据变量为等距变量。 顺序量尺(Ordina
3、l Measurement) 顺序量尺又叫等级量尺,它的特点是:既无绝对零点,又无相等单位。用这种量尺对研究对象进行测量,只能给对象排个顺序。 顺序量尺的测量结果原则上不能进行加、减、乘、除四则运算。如有必要的话,只能进行不等式运算。用这种量尺测量得到的数据变量为顺序变量。 分类量尺(Nominal Measurement) 分类测量不包含任何类间数量关系的假定,仅仅是把测量对象分为相同或相异,但在性质上没有哪一类较大,哪一类较小之分。即无大小之分,也无等级之分。分类标准称为分类量尺。用这种量尺得到的数据变量为分类变量。 三、常见数据的特点 数据分类与特点 1.计数数据 1 (1)概念:是指计
4、算个数的数据。 (2)特点:是非连续的离散数据。它的统计方法具有独特性。 2.测量数据 测量数据是指借助于一定测量工具或依据一定测量标准所获得的数据。 (1)等比数据:指具有测量的绝对零点,又有相等单位的测量数据。 (2)等距数据:指没有测量的绝对零点,只有相等单位的测量数据。 (3)等级数据:是指只依据数据的大小、高低、快慢等属性排出顺序的数据。 3数据特点 随机性 教育与心理研究中的数据具有随机性,即在相同的实验条件下,或同一个人对同一个刺激的反应事先无法确定,具有偶然性,而且观测到的数据不止一个,是随机波动的。 (2)离散性 教育与心理研究中的每一个数据都是离散的,并不连续。即在相同的实
5、验条件下,或对同一个刺激,不同人的反应是不同的,数据分散。 (3)变异性 数据的变异性是指数据的波动有一定的规律,在一定范围内波动。因此波动是可以预测的。 四、统计图 条形图 它主要用于表示离散性变量的统计事项。条形图用宽度相同的长条的长短表示各事物间数量的大小与数量之间的差异。 (二)圆形图 又称作饼图。适用于间断性的数据资料,它以单位圆内各扇形面积所占整个圆形面积的百分比来表示各统计事项在其总体中所占相应比例的一种图示方法。 (三)线形图 线形图是以起伏的折线来表示某种事物的发展变化及演变趋势的统计图。适用于连续性资料。 直方图 直方图是表示连续性资料的频数分配,它是以各组上下限上矩形的面
6、积表示频数分配的一种条形图,是统计学中常用而又有特殊意义的一种统计图。 散点图 又称点图,散点图是用平面直角坐标系上点的散布图形来表示两种事物之间的相关性及联系模式。散点图适合于描述二元变量的观测数据。 第三节 次数分布表与次数分布图 所谓次数分布,指的是一批数据中各个不同数值所出现的次数情况,或者是指一批数据在量尺上各等距区组内所出现的次数情况。对数据进行分组归类,考察数据在量尺上各等距区组内的次数分布情况,并把这种情况用规范的表格形式加以体现,则为次数分布表,其实质是反映一批数据在各等距区组内的次数分布结构。若用图形来表达,那就叫做次数分布图。 一、次数分布表 (一)次数分布表的编制步骤
7、1求全距 2 全距指在一批数据中最大数与最小数之间的差距,用符号R表示,计算公式为: R=Max-Min 2定组数 定组数就是要确定一下把整批数据划分为多少个等距的区组,用符号K表示,它的大小要看数据的多少而定。如果数据来自正态总体,则可利用下述经验公式来确定组数: K=1.87(N一l)2/5 上述公式中的N为数据个数。 3.定组距 组距用符号i表示,其一般原则是取奇数或5的倍数:i=R/K 4.列出分组区间(组限) 组限是每个组的起始点界限。要求是: 高区间内包含最大值,最低区间包含最小值。 最高组和最低组的下限最好是组距的整倍数。 5.求组中值 组中值是各组上下限的中点的数值,其计算公式
8、为 组中值=(组实上限十组实下限)/2 6.登记频数 设计一个表的格式来记录上述有关结果并对数据进行归类划记。 相对次数和百分次数分布表 相对次数就是各组的次数f与总次数N之间的比值,若以Rf表示相对次数,则 Rf=f/N 相对分布表包括:组别,组中值,频数。 相对次数是一个小数,如果将每个相对次数乘以百分之百,就可以得到相对应的百分次数。 相对次数分布表的用途: 相对次数分布表主要能反映各组数据的百分比结构。 实际累积次数分布表 累计次数分布表分为实际累积次数分布表和相对累积次数分布表。实际累积次数分布表又分为上限以下实际累积次数分布表和下限以上实际累积次数分布表。 上限以下实际累积次数分布
9、表 从简单次数分布表的第一组逐项向上累加,得出每一组的累加值,一直加到最高一组,就构成一个累积次数分布表。 下限以上实际累积次数分布表 方法同上限以下累积次数分布表,但方向相反。 、相对累积次数分布表 累积相对次数是对相对次数进行累积的结果。 相对累积次数分布表也分为上限以下相对累积次数分布表和下限以上相对累积次数分布表。 1上限以下相对累积次数分布表 上限以下相对累积次数分布表是从最低组往最高组的方向依次把有关各组的相对次数进行累加的结果。 2下限以上相对累积次数分布表 下限以上相对累积次数分布表是从最高组往最低组的方向依次把有关各组的相对次3 数进行累加的结果。 二、次数分布图 1次数直方
10、图 2次数多边图 3累积次数直方图 4累加次数曲线 5相对累加次数曲线 第三章 集中趋势的度量 第一节 集中量数 一组数据常用两类统计量来表现数据的特征。一类是表现数据的集中性质或集中程度;另一类是表现的数据离散性质或离散程度。 集中性质 数据的集中趋势的度量是指用一组数据的中心位置来度量一组数据的集中趋势,或是描述它们的中心位于何处。描述数据集中情况的统计量有多种,包括算术平均数、中数、众数、几何平均数、调和平均数、加权平均数等。 离散性质 离散性反映一组数据的分散程度,即次数分布的离散程度。对其数量化描述称为次数分布变异特性的度量或差异量数。中心位置相同的次数分布,其离散程度不一定相同。
11、一、算术平均数 一、算术平均数 算术平均数简称为平均数,也称其为均数或均值,常用字母u或X表示。算术平均数是用以度量连续变量次数分布的集中趋势的最常用的集中量数。它是“真值”渐近、最佳的估计值。公式: Xi X=N 算术平均数的性质: 1在一组数据中每个变量与平均数之差 (称为离均差)的总和等于0。 Sxi=0。 2在一组数据中,每一个数都加上一常数C,则所得的平均数为原来的平均数加常数C: S(Xi十C)=X十C N 3在一组数据中,每一个数都乘以一个常数C,则所得的平均数为原来的平均数乘以常数C: S(XiC)= CSXi =CX N N (二) 加权平均数 加权平均数计算公式为: Mw
12、= W1X1+W2X2+WnXn = SWiXi W1+W2+Wn SWi 4 式中:Wi为权重,所谓权数是指各变量在构成总体中的相对重要性。 几何平均数(Geometric mean) 几何平均数符号记作Mg。 有时又称作对数平均数。 1几何平均数的应用条件 当处理的数据有以下几种情形时,一般用几何平均数来表示数据的集中趋势: (1) 一组数据中任何两个相邻数据之比接近于常数,即数据按一定的比例关系变化。例如,在教育与心理研究中,求平均增长率; (2) 当一组数据中存在极端数据,分布呈偏态时,算术平均数不能很好地反映数据的典型情况; (3) 对心理学中的等距与等比量表实验的数据处理均可使用几
13、何平平均数或其他集中量数 (如中数、众数)来反映数据的典型情况。 2几何平均数的基本公式 Mg =nX1X2Xn 式中: n数据个数; X1数据变量的值 3在计算上常使用对数方法: lgMg= SlgXi N N 因此,几何平均数又叫对数平均数。 4几何平均数在教育与心理研究中的应用 (1) 等距与等比量表实验的数据处理 (2)教育与心理研究中平均增长率的计算 一组数据如果彼此之间变异较大,几乎是按一定比例关系变化,如教育经费的增加,学习、阅读的进步,学校招生人数的增加等,一般要求的不是平均数,而是增长率,这就需要用几何平均数计算平均比率,而不用算术平均数。 Mg=N-1XN/X1调和平均数
14、调和平均数用符号Mh表示。它的计算公式是: MH=11N1Xi=N1Xi公式中:N为数据的个数; Xi为变量值,随实验研究设计不同其含义不同。 因在计算中先将各数据取倒数平均,然后再取倒数,故又称倒数平均数。 在研究学习速度的实验设计中,一般常取两种形式: 1学习任务的工作量相同而所用时间不等 2学习任务的时间相同而工作量不等 二、中数 中数又称中点数,中位数,简写为Md,或Mdn。 5 首先把数据资料从大到小排成序列,位于中间位置的那个数据的测量值即为中数。也就是说,如果将数据依大小顺序排列,中数恰于中间,它将数据的数目分成较大的一半和较小的一半。 单列数目的情况 单列数目的情况是指,在一组
15、数列中,每个数只有一个,即没有重复数。 求中数步骤: 如果数据未排序,先进行排序; 按数据总数的奇偶,分别按下列方法求。 1奇数目求中数的方法 当数据总数为奇数时,第(N+l)/2的那个数据的值即为中数。 2偶数目求中数的方法 当数据总数为偶数时,则取序列为第N/2与第N/2+1这两个数据的均数为中数。即将第N/2的数和第 N/2+1的数据的值相加,然后将它们的和除以2,所得数值即为中数。 重复数目的情况 重复数目是指一组数据中有数值相同的数。计算中数的方法基本同单列数目,但当位于中间的那几个数是重复数目时,求中数的方法就比较复杂了。具体算法如下: 1重复数目情况下奇数目求中数的方法 重复数目
16、不在中间位置 方法同数据总数为奇数的求法,即第(N+l)/2的那个数据的值即为中数。 几个连续重复数目在中间位置 取序列中上下各N/2那一点上的数值为中数。 2重复数目情况下偶数目求中数的方法 如果数据个数是偶数,作法也同奇数基本相同。 中数是将整个数据的个数分作大的一半和小的一半,而不是将数据的值分作相等的两部分,即是个数的中数,而不是数值的中数。 (三)次数分布表求中数的方法 将原始数据整理成次数分布表后,求中数的方法同重复数目求中数是一样的,也是取序列中将N平分为两半的那一点的值作为中数。其具体步骤如下: 第一步:求N/2,并找到N/2所在的分组区间; 第二步:求含有中数那一区间以下各区
17、间的次数和 (即中数区间下限以下的累加次数)记作Fb; 第三步:求N/2与Fb之差; 第四步:求序列为第N/2那一点的值。 求中数的公式可整理如下: Md=Lb+N/2-Fb fmd 同理,用精确上限计算可写出下式: Md=La+N/2-Fa Fmd 式中:La为中数所在分组区间的精确上限; Fa为该组以上各组的累加次数; i为组距。 6 中数的意义与应用 1优点:从中数的计算可以看出优点有以下几点: 计算简单,客观 不受极端数据的影响 2缺点:中数也有些不足: 反应不够灵敏 中数的数值不稳定 中数不能进一步再做代数运算 中数不能普遍应用 在一般情况下,中数只是在以下几种特殊情况时,才应用。这
18、些特殊情况是: a观测结果的两端出现极端数 b次数分布中的两端数据或个别数据不清楚 c当作数据集中趋势的快速估计值 三、众数 众数又称为范数,密集数,通常数等。常用符号Mo表示。众数是指在一组数据中出现次数最多的数值,或次数分布中出现次数最多的那个数的数值。 (一)直接观察求众数 直接观察求众数的方法很简单,通过观察找出出现次数最多的数据就是众数。 (二)用公式求众数 众数可用公式计算,称为数理众数。 1皮尔逊的经验法 当数据分布接近正态的情况下可应用此种方法。 众数计算公式: Mo=3Md-2X 式中:Md中数; X平均数。 用皮尔逊的经验法计算的众数,只能作为一个近似值,它不受次数分布的影
19、响。 2金氏(W.IKing)插补法 M。=Lb+ fa i fa+fb 式中:Lb为含众数这一区间的精确下限; fa为众数所在组的高一个分组区间的次数; fb为众数所在组的低一个分组区间的次数。 i为组距。 当fa=fb时,则M。=Lb+1/2i,即次数最多那一分组区间的组中值。 金氏(W.IKing)插补法公式即适合次数分布比较偏斜的情况,也适用比较接近正态分布的情况。 上述两个公式所求得的众数略有出入。均为近似值。 3.众数的意义和应用 众数反映了一组数据中,哪种数据值最多。在某些情况下有一定意义。 众数可作集中趋势的快速估计值 数据同质性不好时,可求众数 数据中有极大或极小的情况 用平
20、均数与众数之差估计次数分布的形态 4众数的不足之处 7 不稳定,受分组的影响 反应不够灵敏 数值不精确,不能作进一步的代数运算 总数乘以众数与数据总数不相等 四、平均数、中数、众数之间的关系和比较 1平均数、中数、众数之间的关系 在一个正态分布中,平均数、中数、众数三者相等,因此在数轴上三点重合,即M=Md=Mo。 在正偏态分布中:MMdMo 在负偏态分布中: MMdMo 在负偏态分布中: MMdMo 一般偏态情况下,中数Md离平均数M较近、而距众数Mo较远。皮尔逊研究其经验关系得出以下结论:M与Md的距离占M与Mo距离的1/3,而Md与Mo占2/3,即 /=1/3。 因而推导出:Mo=3Md
21、-2M 2平均数、中数、众数之间的比较 三种集中量数中,平均数是最常用的一种。它的意义最容易理解,也最为人们所熟悉。计算平均数时,每一个测量值都加入了计算,因此比求中数和众数时使用了更多的信息。它还有一些中数和众数不具有的特性。 第四章 离中趋势的度量 一、离散性质 对于数据的变异性,或离中趋势进行度量的一组统计量,就称作差异量数。这些差异量数包括:标准差或方差,全距,平均差,四分差及各种百分差等等。 二、离中趋势的度量 1全距 最简单的差异量数为全距。全距也称为两极差。它是数据分散趋势的最简单描述指标。可以用最大值减最小值:R=MAX-MIN。 如果由分组资料计算全距,应该用最高组的上限减最
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 心理统计学 心理 统计学 复习 要点 17

链接地址:https://www.31ppt.com/p-3179028.html