大学心理测量学.ppt
《大学心理测量学.ppt》由会员分享,可在线阅读,更多相关《大学心理测量学.ppt(238页珍藏版)》请在三一办公上搜索。
1、心理测量学,Psychological Testing,一、说明(一)课程性质 本课程适合于大学本科心理学、教育科学等专业的本科生及研究生教育。本课程的学习将有助于实验设计、教育评价、心理与教育统计学等学科的学习,是培养学生科学研究及掌握研究方法的基础性学科。(二)教学目的 通过学习,要求学生掌握心理测量的基本知识、心理测量的编制和实施、以及良好测量所要求具备的基本条件。更重要的是,通过本课程的学习要使学生熟练掌握不同心理测量的实际应用。(三)教学内容 本课程的主要教学内容有:心理测量的基本内涵及其评价和测量的一般步骤和方法两部分。内容涉及一般测量解析,测量的要素及量表类型,测验信、效度、难度
2、和区分度,测量的一般步骤和方法,智力测验、人格测验等心理测验,以及心理测量的综合应用和心理测量理论的新发展等内容。(四)教学时数 54个课时(五)教学方式 课堂教学与实践应用相结合。,第一编 心理测量的基本内涵及其评价第一章 绪论教学要点:通过本章的学习,了解测量的基本性质及其要素,测量量表的四种水平,心里测量的本质、基本条件及功能,心里测量的发展以及心理测量的道德准则等内容,对心理测量有一个概括化的了解。教学时数:10学时 教学内容:一、一般测量解析1测量(Measurement)概论2测量的分类3心理测量的种类(1)以测量对象来分,(2)以测量的目的来分,(3)以测量的方式来分类,(4)以
3、项目结构或组成形式来分,(5)按评价参照的标准分类4测量与测验(Test)、考试(Examination)、评价(Evaluation)联系与区别,二、测量的要素及量表类型1测量的要素识记:单位(Unit),参照点(Reference Point),量表(Scale)2量表类型(1)称名量表 称名变量只说明某一事物与其他事物在名称、类别或属性上的不同,并不说明事物与事物之间差异的大小、顺序的先后及质的优劣。(2)顺序变量顺序变量是指可以就事物的某一属性的多少或大小按次序将各事物加以排列的变量,具有等级性和次序性的特点。(3)等距变量等距变量除能表明量的相对大小外,还具有相等的单位。(4)比率变
4、量比率变量除了具有量的大小、相等单位外,还有绝对零点。,三、心理测量的本质、基本条件及功能1心理测量的本质2编制心理测验的基本条件3心理测量的功能(1)理论研究功能,(2)实际应用功能四、心理测量发展简史1主观经验性考试阶段(1864年以前)2客观标准化测验阶段(1864年1940年)3客观测验的深入发展阶段(1940年)4西方心理测量的发展5心理测验在我国的发展,(五)心理测量的道德准则1心理测量工作者的素质要求(1)心理测量工作的知识结构.(2)对心理测量的态度2心理测量工作者的道德准则(1)测验的保密和控制原则(2)测验中个人隐私的保护 考核要求:1心理测量的种类2测量与测验(Test)
5、、考试(Examination)、评价(Evaluation)联系与区别3测量的要素及量表类型单位,参照点,量表,称名量表,顺序变量,等距变量,比率变量4.心理测量的本质、基本条件及功能5.心理测量发展简史,第二章 经典测验理论的基本假设 教学要点:通过本章的学习,掌握经典测验理论的基本假设,心里特之及其特性,心里测量的误差和种类,以及真分数的含义等内容。教学时数:6学时 教学内容:一、心理特质(Trait)及其可测性假设1经典测验(Classical Test Theory,CTT)理论2特质假设,二、测量误差及其来源1.测量误差的含义2误差种类识记:随机误差,系统误差3误差来源(1)来自心
6、理测量工具,(2)来自测量对象,(3)来自实测过程(二)真分数模型及其假设1.真分数的含义2真分数数学模型解析领会:(1)几个推理,(2)CTT的基本含义,(3)CTT的基本公式3经典测验理论的不足 考核要求:1心理特质(Trait)及其可测性假设 2测量误差及其来源3真分数模型及其假设4经典测验理论的不足,第三章 测验信度 教学要点:通过本章的学习,掌握信度的意义,信度系数的计算,了解影响信度的主要因素以及提高信度的常用方法等内容。教学时数:4学时 教学内容:一、信度的意义1信度指实测值和真值相差的程度2信度指统计量与参数之间的接近程度3信度是指一种测验对相同的应试者再次测验时引起同样反应的
7、程度二、信度系数的计算1稳定性系数2等值性系数3等值稳定性系数4内部一致性系数5评分者的信度系数,三、提高测验信度的方法1信度系数以多大为宜2影响信度的因素3提高测验信度的方法考核要求:1.信度的意义2.信度系数的计算识记:稳定性系数,等值性系数,等值稳定性系数,内部一致性系数,评分者的信度系数3.提高测验信度的方法,请列举一些你所使用过或接触过的量表,思考:量表的作用是什么?,你如何解释下述现象?,一个很聪明的孩子,测得智商是80分一个学习很好的学生,考试成绩为60分一个人缘很好的人,人际关系测量低于常模值,量表帮助我们了解心理现象(心理特质),就像尺子帮助我们测量身高。,思考:我们如何知道
8、我们有多高?有两个工具:尺子/秤,尺子的数据与我们的目测更一致,而秤盘的数据则与我们的目测不一致。因此,尺子是测量身高的有效工具效度。,什么材料的尺子?钢铁(热胀冷缩)涉及到一致性的问题。信度,物理不等于数学1.70与1.7的关系总结:量表是我们用来了解心理特质的工具,但这个工具是有误差的。误差要控制在一个许可的范围内。,回顾,什么是误差?误差的种类?误差是在测量中与目的无关的变因所产生的不准确或不一致的效应。误差分为随机误差和系统误差。,高尔顿的智力观比奈的智力观判断题、选择题和问答题SX2=ST2+SE2ST2=SV2+SI2SX2=SV2+SI2+SE2,SX2,ST2,信度,稳定性 可
9、靠性 一致性信度乃是一个被测团体真分数的变异数与实得分数的变异数之比。rXX=ST2/SX2,信度的定义二,信度乃是一个被测团体真分数与实得分数的相关系数的平方。rXX=P2TX思考:相关系数的平方?,信度的定义三,信度乃是一个测验X与它的任意一个平行测验X的相关系数。rXX=PXX,A卷:你是一个喜欢热闹的人吗?,1=绝对是 2=是 3=不一定 4=不是 5=绝对不是,B卷:你是一个喜欢安静的人吗?,1=绝对是 2=是 3=不一定 4=不是 5=绝对不是,信度的估计方法,重测信度(Test-Retest Reliability)定义:同一量表,同一被试群体,在不同时间,两次施测,求其相关。实
10、质:表示测验结果的稳定性。故称之为稳定性系数(Coefficient of Stability)形式:施测适当时间再施测,时间间隔的把握,间隔时间越长,稳定性系数越低。适宜时间间隔依照测验目的、性质及被试特点而定。几分钟至几年。年幼儿童,间隔要小;年长群体,间隔可大。智力测验的间隔不能太短,成就测验的间隔不能太长。一般间隔时间不超过六个月。(即不能让被试记住上一次测验的内容,又不能让其特质发生变化,或对所学知识产生遗忘),复本信度(Alternate-form raliability),因为任何测验只是所有可能题目中的一份取样(行为样本),所以可编制许多平行的等值测验,叫做复本。,复本等值要符
11、合下列条件:,各份测验测量的是同一种心理特性。各份测验具有相同的内容和形式。各份测验的题目不应重复。各份测验题目数量相等,难度和区分度大体相同。各份测验的分数分布(平均数和标准差)大致相等。复本编好后,应再测一次,以确保各份测验的等值。,定义:两个复本施测同一被试群体,求其相关。,等值性系数:同时连续施测,反映内容变异。形式:复本A最短时间复本B稳定性与等值性系数:时间间隔施测,内容变异重测信度误差形式:复本A适当时间复本B,分半信度(Split-Half Reliability),定义:在测验没有复本且只能实施一次的情况下,可将测验项目分成对等的两半,根据被试在这两半测验中所得的分数计算相关
12、系数,即得分半信度。计算分半信度先要对测验分半。不同的分半法可能会得到不同的信度值。,分半信度(Split-Half Reliability),为了使两半基本等值,可将项目按由易到难的顺序排列编号,然后按奇数和偶数序号将项目分半。要注意使那些性质相同、联系紧密的项目分在相同的一半,否则会使信度值偏高。由于分半信度实际上只是半个测验的信度,测验越长、项目越多,两半分数的相关就越高。因此,对长度不同的测验,要用校正公式。,同质性信度(Homogeneity Reliability),同质性指测验的所有题目测量的是同一种心理特质,表现为各个题目得分之间有较高的相关,相关越高则同质性越强。因素分析的思
13、路,五、评分者信度(Scorer Reliability),评分者信度是指不同评分者之间在测验结果计分上的一致性。在心理测验中,评分者信度的计算,通常是随机抽取若干份试卷,由至少两位受过训练的评分者按计分规则分别判分,然后计算它们的相关。几个评分者的评分越一致,评分者信度越高。,五、评分者信度(Scorer Reliability),最简单的估计方法就是随机抽取若干份答卷,由两个独立的评分者打分,再求每份答卷两个评判分数的相关系数。这种相关系数的计算可以用积差相关方法,也可以采用斯皮尔曼等级相关方法。如果评分者在三人以上,而且又采用等级记分时,就需要用肯德尔和谐系数来求评分者信度。,估计信度的
14、方法与测验复本的数目以及施测次数的关系,在一般情况下,间隔施测的副本信度最低,因为很多因素有机会影响到分数。相反,校正过的分半相关,因为影响的因素少,所得的信度估计为最高。,各种信度系数相应误差变异的来源,实际上,有多少种误差来源,便有多少种估计信度的方法。一个测验哪种误差大,便应该用哪种误差估计。有时一个测验需要有几种信度系数,这样我们就把总分数的变异数分成不同的分支。,假设对100个六年级学生以两个月的时间间隔先后施测一个创造力测验的AB两个复本,所得的等值性与稳定性系数为0.70。我们还根据被试对每个复本的反应计算出分半信度为0.80(先计算每个复本的分半相关系数。将二者平均后再用斯皮尔
15、曼-布朗公式校正)。同时,我们让另一个评分者随机抽取50份卷子另外评分,得到评分者信度为0.92。然后,我们对这三种方法所产生的误差变异进行分析。,一个假想测验的误差变异来源分析,一个假想测验的误差变异来源分析,第四章 测验的效度 教学要点:通过本章的学习,掌握效度的含义,效度估计方法,了解影响信度与效度的关系,影响效度的因素以及提高信度的几种方法等内容。教学时数:10学时 教学内容:一、效度概述1效度的一般定义及其内涵效度是指测验的准确性,即测验能够测出他们所欲测的特质的程度。2效度的统计与原理3效度的信度关系(1)高效度,高信度(2)高信度,低效度(3)低信度,低效度,二、效度的估计196
16、6年美国心理学会在教育心理测验值标准中将效度分为三大类:1内容效度(Content Validity)内容效度指测验实际测到的内容与所要测量的内容之间的吻合程度。2结构效度(Construct Validity)结构效度是指测验对于被称作构想的某一理论概念或特质测量的程度。3实证效度(Criterion related Validity)实证效度是指一个测验对处于特定情景中的个体的行为进行估计的有效性。三、提高测量效度的方法1各种测量效度的要求2提高效度的方法(1)控制系统误差,(2)精心编制量表,(3)妥善组织测验,(4)扩充样本容量,(5)适当增加测验的长度3效度的一般定义及其内涵效度是指
17、测验的准确性,即测验能够测出他们所欲测的特质的程度。4效度的统计与原理5效度与信度的关系(1)高效度,高信度(2)高信度,低效度(3)低信度,低效度,四、效度的估计1966年美国心理学会在教育心理测验值标准中将效度分为三大类:1内容效度(Content Validity)内容效度指测验实际测到的内容与所要测量的内容之间的吻合程度。2结构效度(Construct Validity)结构效度是指测验对于被称作构想的某一理论概念或特质测量的程度。3实证效度(Criterion related Validity)实证效度是指一个测验对处于特定情景中的个体的行为进行估计的有效性。,五、提高测量效度的方法
18、1各种测量效度的要求2提高效度的方法(1)控制系统误差,(2)精心编制量表,(3)妥善组织测验,(4)扩充样本容量,(5)适当增加测验的长度考核要求:1.效度的一般定义及其内涵2.效度的统计与原理3效度与度的信度关系4.效度的估计内容效度,结构效度,实证效度5.提高测量效度的方法,第五章 测验的难度和区分度 教学要点:通过本章的学习,掌握测验难度和区分度的含义,以及难度、区分度的计算,了解难度、区分度对测验质量的影响等内容。教学时数:10学时 教学内容:一、测验难度的计算1 计算难度的基本公式(1)以试题通过率计算难度:P=R/N,(2)用平均数计算试题的难度2用极端分组法计算难度二、难度的转
19、换难度转换的方法三、测验题目难度水平的确定,四、区分度的定义1定义:区分度是指测验对于考生实际水平的区分度程度或鉴别能力。2区分度与测验信度、难度的关系五、区分度计算1用极端分组法计算(1)客观题计算,(2)论文题计算2用内部一致性系数(Internal Consistency)计算区分度(1)用点二列相关计算区分度(2)用二列相关计算区分度(3)用相关计算区分度(4)用四分相关计算区分度(5)用皮尔逊相关法计算区分度(6)D(鉴别指数)的经验标准,考核要求:1.测验难度的计算2.计算难度的基本公式3难度的转换 4.测验题目难度水平的确定5.区分度的含义6.区分度与测验信度、难度的关系7.区分
20、度计算用极端分组法计算,用内部一致性系数(Internal Consistency)计算区分度,第二编 测量的一般步骤和方法第六章 测验的编制与实施教学要点:通过本章的学习,掌握编制测验的基本程序,测验的实施过程及须注意的事项等内容。教学时数:10学时 教学内容:,第一节 编制心理与教育测验的基本程序 一、确定测验的目的1明确测量对象2明确测量目标3明确测量用途二、制定编题计划三、编辑测验项目1收集测验资料2选择项目形式3编写测验项目四、测验与项目分析1预测2项目分析,五、合成测验1测验项目的选择2测验项目的编排3编制副本六、测验标准化1测验内容2实测过程3测验评分4测验分数解释七、鉴定测验1
21、信度2效度3测验量表与常模 八、编写测验说明书,第二节 测验的实施 一、测验的实施过程1实测前的准备工作2指导语3测验情境4测验焦虑5与受测者建立良好的协调关系6评分技术二、测验分数的解释1如何看待测验分数的意义2如何向受测者报告测验分数,考核要求:1.编制测验的基本程序确定测验的目的,制定编题计划,编辑测验项目,测验与项目分析,合成测验,测验标准化,鉴定测验,编写测验说明书2测验的实施过程及须注意的事项等内容3.测验分数的解释,第七章 测验分数的解释与应用教学要点:通过本章的学习,掌握测验分数的类型,常模及常模类型,以及测验分数的解释和常模的应用等内容。教学时数:4学时 教学内容:一、分数与
22、常模1分数的种类和含义识记:(1)原始分数,(2)导出分数2常模3年龄常模4年级常模5百分等级常模6标准分数常模,二、测验的等值1测验等值的实质2测验等值的条件(1)同质性,(2)等信度,(3)公平性,(4)可递推性,(5)对称性,(6)样本不变性3测验等值的基本算法识记:(1)百分位等值(2)线性等值4常用等值设计5测验等值误差估计 考核要求:1.分数原始分数,导出分数,2常模年龄常模,年级常模,百分等级常模,标准分数常模3.测验的等值的实质与条件4.测验等值的基本算法:百分位等值,线性等值,第八章 测验的项目分析 项目分析包括定性分析和定量分析。定性分析包括考虑内容效度、题目编写的恰当性和
23、有效性等;定量分析主要是指题目难度和区分度的测量。对项目进行筛选和修订,可以提高测验的信度和效度。第一节 测验的难度一、难度(difficulty)的意义难度,指项目的难易程度。在最高作为测验中,称为“难度”,而在典型作为测验中,则指“通俗性”。两者都是指在总体中,能够正确或确切回答某项目的人数。,二、难度的计算(一)二分法记分项目的难度1通过率 P=R/N2极端分组法(上下27%)P=(PH+PL)/2(二)非二分法记分项目的难度 P=X/XmaxX为所有被试在该项目上的平均得分,Xmax为该项目的满分。,三、测验难度水平的确定 效标参照测验、掌握测验:不考虑难度;选拔测验:难度=录取率;对
24、于选择题来说,难度一般应大于猜测概率;无论是速度测验,还是难度测验,一般都应防止被试得满分,因为满分的意义是不明确的。大体而言,难度为0.50时最理想,此时项目具有最大的鉴别力。但在实际操作中,让所有项目难度都到达0.50困难很大,而且也不必要,一般只需使项目的平均难度接近0.50,而各个项目的难度在0.50 0.20之间变化。,四、难度的等距变换根据正态分布表,将难度P作为正态曲线下的面积,转换成相应的Z分数,这就是等距量表。P Y 0 Z,美国教育服务中心以 作为难度指标:=13+4ZP=.0013 Z=+3=25P=.16 Z=+1=17P=.50 Z=0=13P=.84 Z=-1=9P
25、=.9987 Z=-3=1,五、难度对测验的影响(一)测验难度影响测验分数的分布形态 难度大,正偏态 难度低,负偏态,(二)测验难度影响测验分数的离散程度测验过难或过易,分数全距缩小,信度降低。P=0.50时最佳,第二节 测验的区分度一、区分度的意义区分度(discrimination)是指测验项目对被试心理品质水平差异的区分能力或鉴别能力。项目的区分度是测验是否有效的“指示器”。二、区分度的计算(一)项目鉴别指数法1鉴别指数(index of discrimination,D)的计算D=PH-PL取值范围:-1+1,2极端组的划分27%规则一般情况下,取上下25%33%均可。样本少时,可以取
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大学 心理测量学
链接地址:https://www.31ppt.com/p-6109843.html