欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    大学心理测量学.ppt

    • 资源ID:6109843       资源大小:638KB        全文页数:238页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    大学心理测量学.ppt

    心理测量学,Psychological Testing,一、说明(一)课程性质 本课程适合于大学本科心理学、教育科学等专业的本科生及研究生教育。本课程的学习将有助于实验设计、教育评价、心理与教育统计学等学科的学习,是培养学生科学研究及掌握研究方法的基础性学科。(二)教学目的 通过学习,要求学生掌握心理测量的基本知识、心理测量的编制和实施、以及良好测量所要求具备的基本条件。更重要的是,通过本课程的学习要使学生熟练掌握不同心理测量的实际应用。(三)教学内容 本课程的主要教学内容有:心理测量的基本内涵及其评价和测量的一般步骤和方法两部分。内容涉及一般测量解析,测量的要素及量表类型,测验信、效度、难度和区分度,测量的一般步骤和方法,智力测验、人格测验等心理测验,以及心理测量的综合应用和心理测量理论的新发展等内容。(四)教学时数 54个课时(五)教学方式 课堂教学与实践应用相结合。,第一编 心理测量的基本内涵及其评价第一章 绪论教学要点:通过本章的学习,了解测量的基本性质及其要素,测量量表的四种水平,心里测量的本质、基本条件及功能,心里测量的发展以及心理测量的道德准则等内容,对心理测量有一个概括化的了解。教学时数:10学时 教学内容:一、一般测量解析1测量(Measurement)概论2测量的分类3心理测量的种类(1)以测量对象来分,(2)以测量的目的来分,(3)以测量的方式来分类,(4)以项目结构或组成形式来分,(5)按评价参照的标准分类4测量与测验(Test)、考试(Examination)、评价(Evaluation)联系与区别,二、测量的要素及量表类型1测量的要素识记:单位(Unit),参照点(Reference Point),量表(Scale)2量表类型(1)称名量表 称名变量只说明某一事物与其他事物在名称、类别或属性上的不同,并不说明事物与事物之间差异的大小、顺序的先后及质的优劣。(2)顺序变量顺序变量是指可以就事物的某一属性的多少或大小按次序将各事物加以排列的变量,具有等级性和次序性的特点。(3)等距变量等距变量除能表明量的相对大小外,还具有相等的单位。(4)比率变量比率变量除了具有量的大小、相等单位外,还有绝对零点。,三、心理测量的本质、基本条件及功能1心理测量的本质2编制心理测验的基本条件3心理测量的功能(1)理论研究功能,(2)实际应用功能四、心理测量发展简史1主观经验性考试阶段(1864年以前)2客观标准化测验阶段(1864年1940年)3客观测验的深入发展阶段(1940年)4西方心理测量的发展5心理测验在我国的发展,(五)心理测量的道德准则1心理测量工作者的素质要求(1)心理测量工作的知识结构.(2)对心理测量的态度2心理测量工作者的道德准则(1)测验的保密和控制原则(2)测验中个人隐私的保护 考核要求:1心理测量的种类2测量与测验(Test)、考试(Examination)、评价(Evaluation)联系与区别3测量的要素及量表类型单位,参照点,量表,称名量表,顺序变量,等距变量,比率变量4.心理测量的本质、基本条件及功能5.心理测量发展简史,第二章 经典测验理论的基本假设 教学要点:通过本章的学习,掌握经典测验理论的基本假设,心里特之及其特性,心里测量的误差和种类,以及真分数的含义等内容。教学时数:6学时 教学内容:一、心理特质(Trait)及其可测性假设1经典测验(Classical Test Theory,CTT)理论2特质假设,二、测量误差及其来源1.测量误差的含义2误差种类识记:随机误差,系统误差3误差来源(1)来自心理测量工具,(2)来自测量对象,(3)来自实测过程(二)真分数模型及其假设1.真分数的含义2真分数数学模型解析领会:(1)几个推理,(2)CTT的基本含义,(3)CTT的基本公式3经典测验理论的不足 考核要求:1心理特质(Trait)及其可测性假设 2测量误差及其来源3真分数模型及其假设4经典测验理论的不足,第三章 测验信度 教学要点:通过本章的学习,掌握信度的意义,信度系数的计算,了解影响信度的主要因素以及提高信度的常用方法等内容。教学时数:4学时 教学内容:一、信度的意义1信度指实测值和真值相差的程度2信度指统计量与参数之间的接近程度3信度是指一种测验对相同的应试者再次测验时引起同样反应的程度二、信度系数的计算1稳定性系数2等值性系数3等值稳定性系数4内部一致性系数5评分者的信度系数,三、提高测验信度的方法1信度系数以多大为宜2影响信度的因素3提高测验信度的方法考核要求:1.信度的意义2.信度系数的计算识记:稳定性系数,等值性系数,等值稳定性系数,内部一致性系数,评分者的信度系数3.提高测验信度的方法,请列举一些你所使用过或接触过的量表,思考:量表的作用是什么?,你如何解释下述现象?,一个很聪明的孩子,测得智商是80分一个学习很好的学生,考试成绩为60分一个人缘很好的人,人际关系测量低于常模值,量表帮助我们了解心理现象(心理特质),就像尺子帮助我们测量身高。,思考:我们如何知道我们有多高?有两个工具:尺子/秤,尺子的数据与我们的目测更一致,而秤盘的数据则与我们的目测不一致。因此,尺子是测量身高的有效工具效度。,什么材料的尺子?钢铁(热胀冷缩)涉及到一致性的问题。信度,物理不等于数学1.70与1.7的关系总结:量表是我们用来了解心理特质的工具,但这个工具是有误差的。误差要控制在一个许可的范围内。,回顾,什么是误差?误差的种类?误差是在测量中与目的无关的变因所产生的不准确或不一致的效应。误差分为随机误差和系统误差。,高尔顿的智力观比奈的智力观判断题、选择题和问答题SX2=ST2+SE2ST2=SV2+SI2SX2=SV2+SI2+SE2,SX2,ST2,信度,稳定性 可靠性 一致性信度乃是一个被测团体真分数的变异数与实得分数的变异数之比。rXX=ST2/SX2,信度的定义二,信度乃是一个被测团体真分数与实得分数的相关系数的平方。rXX=P2TX思考:相关系数的平方?,信度的定义三,信度乃是一个测验X与它的任意一个平行测验X的相关系数。rXX=PXX,A卷:你是一个喜欢热闹的人吗?,1=绝对是 2=是 3=不一定 4=不是 5=绝对不是,B卷:你是一个喜欢安静的人吗?,1=绝对是 2=是 3=不一定 4=不是 5=绝对不是,信度的估计方法,重测信度(Test-Retest Reliability)定义:同一量表,同一被试群体,在不同时间,两次施测,求其相关。实质:表示测验结果的稳定性。故称之为稳定性系数(Coefficient of Stability)形式:施测适当时间再施测,时间间隔的把握,间隔时间越长,稳定性系数越低。适宜时间间隔依照测验目的、性质及被试特点而定。几分钟至几年。年幼儿童,间隔要小;年长群体,间隔可大。智力测验的间隔不能太短,成就测验的间隔不能太长。一般间隔时间不超过六个月。(即不能让被试记住上一次测验的内容,又不能让其特质发生变化,或对所学知识产生遗忘),复本信度(Alternate-form raliability),因为任何测验只是所有可能题目中的一份取样(行为样本),所以可编制许多平行的等值测验,叫做复本。,复本等值要符合下列条件:,各份测验测量的是同一种心理特性。各份测验具有相同的内容和形式。各份测验的题目不应重复。各份测验题目数量相等,难度和区分度大体相同。各份测验的分数分布(平均数和标准差)大致相等。复本编好后,应再测一次,以确保各份测验的等值。,定义:两个复本施测同一被试群体,求其相关。,等值性系数:同时连续施测,反映内容变异。形式:复本A最短时间复本B稳定性与等值性系数:时间间隔施测,内容变异重测信度误差形式:复本A适当时间复本B,分半信度(Split-Half Reliability),定义:在测验没有复本且只能实施一次的情况下,可将测验项目分成对等的两半,根据被试在这两半测验中所得的分数计算相关系数,即得分半信度。计算分半信度先要对测验分半。不同的分半法可能会得到不同的信度值。,分半信度(Split-Half Reliability),为了使两半基本等值,可将项目按由易到难的顺序排列编号,然后按奇数和偶数序号将项目分半。要注意使那些性质相同、联系紧密的项目分在相同的一半,否则会使信度值偏高。由于分半信度实际上只是半个测验的信度,测验越长、项目越多,两半分数的相关就越高。因此,对长度不同的测验,要用校正公式。,同质性信度(Homogeneity Reliability),同质性指测验的所有题目测量的是同一种心理特质,表现为各个题目得分之间有较高的相关,相关越高则同质性越强。因素分析的思路,五、评分者信度(Scorer Reliability),评分者信度是指不同评分者之间在测验结果计分上的一致性。在心理测验中,评分者信度的计算,通常是随机抽取若干份试卷,由至少两位受过训练的评分者按计分规则分别判分,然后计算它们的相关。几个评分者的评分越一致,评分者信度越高。,五、评分者信度(Scorer Reliability),最简单的估计方法就是随机抽取若干份答卷,由两个独立的评分者打分,再求每份答卷两个评判分数的相关系数。这种相关系数的计算可以用积差相关方法,也可以采用斯皮尔曼等级相关方法。如果评分者在三人以上,而且又采用等级记分时,就需要用肯德尔和谐系数来求评分者信度。,估计信度的方法与测验复本的数目以及施测次数的关系,在一般情况下,间隔施测的副本信度最低,因为很多因素有机会影响到分数。相反,校正过的分半相关,因为影响的因素少,所得的信度估计为最高。,各种信度系数相应误差变异的来源,实际上,有多少种误差来源,便有多少种估计信度的方法。一个测验哪种误差大,便应该用哪种误差估计。有时一个测验需要有几种信度系数,这样我们就把总分数的变异数分成不同的分支。,假设对100个六年级学生以两个月的时间间隔先后施测一个创造力测验的AB两个复本,所得的等值性与稳定性系数为0.70。我们还根据被试对每个复本的反应计算出分半信度为0.80(先计算每个复本的分半相关系数。将二者平均后再用斯皮尔曼-布朗公式校正)。同时,我们让另一个评分者随机抽取50份卷子另外评分,得到评分者信度为0.92。然后,我们对这三种方法所产生的误差变异进行分析。,一个假想测验的误差变异来源分析,一个假想测验的误差变异来源分析,第四章 测验的效度 教学要点:通过本章的学习,掌握效度的含义,效度估计方法,了解影响信度与效度的关系,影响效度的因素以及提高信度的几种方法等内容。教学时数:10学时 教学内容:一、效度概述1效度的一般定义及其内涵效度是指测验的准确性,即测验能够测出他们所欲测的特质的程度。2效度的统计与原理3效度的信度关系(1)高效度,高信度(2)高信度,低效度(3)低信度,低效度,二、效度的估计1966年美国心理学会在教育心理测验值标准中将效度分为三大类:1内容效度(Content Validity)内容效度指测验实际测到的内容与所要测量的内容之间的吻合程度。2结构效度(Construct Validity)结构效度是指测验对于被称作构想的某一理论概念或特质测量的程度。3实证效度(Criterion related Validity)实证效度是指一个测验对处于特定情景中的个体的行为进行估计的有效性。三、提高测量效度的方法1各种测量效度的要求2提高效度的方法(1)控制系统误差,(2)精心编制量表,(3)妥善组织测验,(4)扩充样本容量,(5)适当增加测验的长度3效度的一般定义及其内涵效度是指测验的准确性,即测验能够测出他们所欲测的特质的程度。4效度的统计与原理5效度与信度的关系(1)高效度,高信度(2)高信度,低效度(3)低信度,低效度,四、效度的估计1966年美国心理学会在教育心理测验值标准中将效度分为三大类:1内容效度(Content Validity)内容效度指测验实际测到的内容与所要测量的内容之间的吻合程度。2结构效度(Construct Validity)结构效度是指测验对于被称作构想的某一理论概念或特质测量的程度。3实证效度(Criterion related Validity)实证效度是指一个测验对处于特定情景中的个体的行为进行估计的有效性。,五、提高测量效度的方法1各种测量效度的要求2提高效度的方法(1)控制系统误差,(2)精心编制量表,(3)妥善组织测验,(4)扩充样本容量,(5)适当增加测验的长度考核要求:1.效度的一般定义及其内涵2.效度的统计与原理3效度与度的信度关系4.效度的估计内容效度,结构效度,实证效度5.提高测量效度的方法,第五章 测验的难度和区分度 教学要点:通过本章的学习,掌握测验难度和区分度的含义,以及难度、区分度的计算,了解难度、区分度对测验质量的影响等内容。教学时数:10学时 教学内容:一、测验难度的计算1 计算难度的基本公式(1)以试题通过率计算难度:P=R/N,(2)用平均数计算试题的难度2用极端分组法计算难度二、难度的转换难度转换的方法三、测验题目难度水平的确定,四、区分度的定义1定义:区分度是指测验对于考生实际水平的区分度程度或鉴别能力。2区分度与测验信度、难度的关系五、区分度计算1用极端分组法计算(1)客观题计算,(2)论文题计算2用内部一致性系数(Internal Consistency)计算区分度(1)用点二列相关计算区分度(2)用二列相关计算区分度(3)用相关计算区分度(4)用四分相关计算区分度(5)用皮尔逊相关法计算区分度(6)D(鉴别指数)的经验标准,考核要求:1.测验难度的计算2.计算难度的基本公式3难度的转换 4.测验题目难度水平的确定5.区分度的含义6.区分度与测验信度、难度的关系7.区分度计算用极端分组法计算,用内部一致性系数(Internal Consistency)计算区分度,第二编 测量的一般步骤和方法第六章 测验的编制与实施教学要点:通过本章的学习,掌握编制测验的基本程序,测验的实施过程及须注意的事项等内容。教学时数:10学时 教学内容:,第一节 编制心理与教育测验的基本程序 一、确定测验的目的1明确测量对象2明确测量目标3明确测量用途二、制定编题计划三、编辑测验项目1收集测验资料2选择项目形式3编写测验项目四、测验与项目分析1预测2项目分析,五、合成测验1测验项目的选择2测验项目的编排3编制副本六、测验标准化1测验内容2实测过程3测验评分4测验分数解释七、鉴定测验1信度2效度3测验量表与常模 八、编写测验说明书,第二节 测验的实施 一、测验的实施过程1实测前的准备工作2指导语3测验情境4测验焦虑5与受测者建立良好的协调关系6评分技术二、测验分数的解释1如何看待测验分数的意义2如何向受测者报告测验分数,考核要求:1.编制测验的基本程序确定测验的目的,制定编题计划,编辑测验项目,测验与项目分析,合成测验,测验标准化,鉴定测验,编写测验说明书2测验的实施过程及须注意的事项等内容3.测验分数的解释,第七章 测验分数的解释与应用教学要点:通过本章的学习,掌握测验分数的类型,常模及常模类型,以及测验分数的解释和常模的应用等内容。教学时数:4学时 教学内容:一、分数与常模1分数的种类和含义识记:(1)原始分数,(2)导出分数2常模3年龄常模4年级常模5百分等级常模6标准分数常模,二、测验的等值1测验等值的实质2测验等值的条件(1)同质性,(2)等信度,(3)公平性,(4)可递推性,(5)对称性,(6)样本不变性3测验等值的基本算法识记:(1)百分位等值(2)线性等值4常用等值设计5测验等值误差估计 考核要求:1.分数原始分数,导出分数,2常模年龄常模,年级常模,百分等级常模,标准分数常模3.测验的等值的实质与条件4.测验等值的基本算法:百分位等值,线性等值,第八章 测验的项目分析 项目分析包括定性分析和定量分析。定性分析包括考虑内容效度、题目编写的恰当性和有效性等;定量分析主要是指题目难度和区分度的测量。对项目进行筛选和修订,可以提高测验的信度和效度。第一节 测验的难度一、难度(difficulty)的意义难度,指项目的难易程度。在最高作为测验中,称为“难度”,而在典型作为测验中,则指“通俗性”。两者都是指在总体中,能够正确或确切回答某项目的人数。,二、难度的计算(一)二分法记分项目的难度1通过率 P=R/N2极端分组法(上下27%)P=(PH+PL)/2(二)非二分法记分项目的难度 P=X/XmaxX为所有被试在该项目上的平均得分,Xmax为该项目的满分。,三、测验难度水平的确定 效标参照测验、掌握测验:不考虑难度;选拔测验:难度=录取率;对于选择题来说,难度一般应大于猜测概率;无论是速度测验,还是难度测验,一般都应防止被试得满分,因为满分的意义是不明确的。大体而言,难度为0.50时最理想,此时项目具有最大的鉴别力。但在实际操作中,让所有项目难度都到达0.50困难很大,而且也不必要,一般只需使项目的平均难度接近0.50,而各个项目的难度在0.50 0.20之间变化。,四、难度的等距变换根据正态分布表,将难度P作为正态曲线下的面积,转换成相应的Z分数,这就是等距量表。P Y 0 Z,美国教育服务中心以 作为难度指标:=13+4ZP=.0013 Z=+3=25P=.16 Z=+1=17P=.50 Z=0=13P=.84 Z=-1=9P=.9987 Z=-3=1,五、难度对测验的影响(一)测验难度影响测验分数的分布形态 难度大,正偏态 难度低,负偏态,(二)测验难度影响测验分数的离散程度测验过难或过易,分数全距缩小,信度降低。P=0.50时最佳,第二节 测验的区分度一、区分度的意义区分度(discrimination)是指测验项目对被试心理品质水平差异的区分能力或鉴别能力。项目的区分度是测验是否有效的“指示器”。二、区分度的计算(一)项目鉴别指数法1鉴别指数(index of discrimination,D)的计算D=PH-PL取值范围:-1+1,2极端组的划分27%规则一般情况下,取上下25%33%均可。样本少时,可以取50%注意:由于计算机的方便使用,可以上下50%作为划分高低组的标准,或者多分几组,对区分度和难度作详细分析。因为只取上下两端,只利用了一部分资料,浪费了很多信息,有可能得出错误结论。,(二)相关法(项目-总分相关)1点二列相关 Xp-Xq rpb=pq St2二列相关 Xp-Xq pq Xp-Xt p rb=或 rb=St y St y,3 相关 ad-bcr=(a+b)(c+d)(a+c)(b+d)4四分相关5.项目和总分相关重叠的校正当测验项目超过20个项目时,校正法通常毫无意义。rtpSt Sprpq=St2+Sp2 2rtpStSp,(三)项目特征曲线(item characteristic curve,ICC)项目特征曲线描述了效标分数不同的被试在该项目上的通过率。曲线坡度越陡,鉴别力越好,预测的误差越小。,率概的目项答回确正,1.00,0.00,0.50,低 中 高能力,鉴别力较好,低 中 高能力,鉴别力为负,鉴别力较低,难度不同的3个项目的ICC,多项选择中每个选项的ICC,三、区分度与难度的关系,难度和区分度都是针对一定团体而言的。一般来说,较难的项目对高水平被试区分度高,较易的项目对低水平被试的区分度高。,四、区分度的相对性(一)不同的计算方法,所得区分值不同 区分度有几种计算方法?(二)样本容量大小影响相关法区分度值的大小 样本越大,区分度越(三)分组标准影响鉴别指数 分组越极端,区分度越(四)被试样本的同质性程度影响区分度值的大小 样本越同质,区分度越,第三节 项目分析的特殊问题一、多重选择题的项目分析(诱答分析)对于多重选择题,除了分析难度和区分度外,还要对每个选项进行分析。下列哪一个最有可能是偏执型精神分裂症患者的次级症状:A 幻听B 瘫痪C 记忆丧失D 厌食,如果所有被试都选择某一正确的选项,说明该选项 如果没有一个被试选择某个错误选项,说明该选项 如果所有被试都选择某个错误选项,说明该选项 如果高分组被试的选择集中在两个选项上,说明该选项 如果高分组和低分组对正确选项的选择没有区别,说明该选项 如果所有被试都未回答某个题目,说明该题 如果选择各个选项的人数几乎相等,说明该题,二、速度测验的项目分析 对前面部分的测验项目,难度和区分度都 对后面部分的测验项目,难度和区分度都三、标准参照测验的项目分析在标准参照测验中,无须考虑项目的难度和区分度,只要项目的内容很重要就行。也可以通过比较教学或训练的前测和后测结果来进行项目分析,用来说明教学或训练的效果以及项目编制是否适当。,四、项目-团体的相互作用 具有不同性质(性别、种族、职业等)的团体,在测验得分上也存在差异,即同样的项目可能有不同的难度。如果测验要求对所有个体都相对“公平”,那么,就应该排除那些有利于或不利于不同性质的亚团体的项目;如果测验的目的就是为了考察不同亚团体的差异,那么,就应选择使团体差异尽可能大的题目。,五、有效性与可靠性的矛盾 同质性信度要求项目之间有高相关,各项目的难度均等;对于预测效度来说,因为效标的变异范围较大,如果项目越同质,那么效标关联效度则低;因此,效标关联效度要求各项目之间要有一定的差异,即项目之间相关低,这样才能保证测验得分与效标之间有高相关,即高的效标关联效度。因此,对于多数心理测验来说,项目之间中等程度的相关,可使二者调和,获得较为满意的(同质性)信度和(效标关联)效度。,第九章 学绩测验第一节 学绩测验概述一、学绩测验的性质最高作为测验可以分为:学绩测验、能力测验、能力倾向测验。学绩,指经过一定的教学或训练后所学到的东西,是在一个比较明确的、相对限定的范围内的学习结果。能力倾向指学习的能力,是在给予适当的机会时获得某种知识或技能的能力。能力介于学绩和能力倾向之间,指的是当前的知识或技能的水平,既有正式学习的,也有非正式学习的结果,既包括学术技能,又包括非学术技能。学绩测验用来描述现状,指明一个人已经学会了什么和能做什么。,二、学绩测验的基本假设1 学绩测验所测量的知识和技术的范围能明确界定。2 测验所测量的是研究者认为重要的东西,而不是与测量目的无关的东西。3 被试有同样的机会学习测验所包含的材料。三、学绩测验的分类(一)按测验的编制方法分教师自编课堂测验,标准化学绩测验(二)按测验内容分单科测验,多科测验单元测验,总测验,(三)按测验的用途分考察性测验,诊断性测验,准备性测验,选拔与安置测验,职业水平测验,用于研究的测验(四)按测验评分的参照系分常模参照性测验,目标参照性测验(五)按测验的题型分客观测验,论文式测验,四、学绩测验的应用1 反馈功能2 诊断功能3 辅助教学管理4 研究工具5 人才选拔与安置,第二节 标准化学绩测验一、标准化学绩测验的基本要求1 命题组卷标准化 测验目标,试题的措辞、难度、区分度,题型比例、题量2 施测标准化 环境、时间、指导语、主试3 评分标准化 标准答案、评分细则、评分者人数4 测验分数解释标准化 是常模参照还是目标参照,二、标准化学绩测验的编制 由学科专家与测验编制专家共同完成,其步骤与一般心理测验的编制程序相同。(一)确定测验目的,选定测验编制的方法 考察还是诊断,常模参照还是目标参照(二)分析测量目标,拟订测验编制计划 双向细目表,题型,题量(三)编题征题与选题组卷 编题征题试测组卷(四)调查测验质量参数,编制测验常模 难度、区分度、信度、效度、常模(五)编写测验指导书,正式出版发行,三、国外常用标准化学绩测验简介(一)斯坦福成就测验 综合性学绩测验 适用范围:19年级 内容:词汇、阅读理解、拼字、听理解、词汇学习技能、语言、数学概念、数学计算、数学应用、社会科学常识、自然科学常识斯坦福早期学校成就测验(适用于幼儿园和小学一年级)斯坦福学业技能测验(适用于812年级)导出分数:百分等级、标准九、年级当量、量表分数、正态曲线当量分测验信度均在0.80以上。,(二)关键数学算术诊断测验适用范围:学前儿童小学六年级 测验内容:内容块:数学、分数、几何、符号 运算块:加法、减法、乘法、除法、心算、数字推理 应用块:文字题、补充、金钱、测量、时间 诊断:总体水平诊断 分块水平诊断 分测验水平诊断 项目水平诊断,四、标准化学绩测验的题库建设 一个高质量的题库应具有的性质:有一种科学的测量理论;贮备一定数量的试题,所有试题品质优良,技术参数完备;题库内部结构层次清楚、分类严谨,试题检索方便;题库管理方便,可控性强,易于维护更新;保密性强。五、我国高考的标准化试验,第三节 教师自编课堂测验一、教师自编课堂测验的特点 测验形式灵活多变,与测验目的完全一致 测验内容与教材内容完全一致 测验难度切合学生的实际水平 测验编制简易快速二、教师自编课堂测验的步骤与方法 审查测验目的 制定测验编制计划 命题与组卷,三、教师自编课堂测验应注意的问题 教师要深入研究教材,深入研究学生 要维护准确稳定的合格标准 要客观评价自己的命题技术,合理使用各种题型 要注意总结命题经验,提高命题技术 要尽量控制评分误差,防止简单粗糙 要做一些定量分析研究,第十章 能力测验(上)第一节 智力测验的理论基础(一)什么是智力?Spearman(1904,1923):智力是一种普遍的能力,它主要涉及联系的引出(eduction)和相关的引出。Binet&Simon(1905):智力是正确进行理解、判断和推理的能力。Terman(1916):智力是形成概念,并且抓住其重要性的能力。Thorndike(1921):智力是从真理或事实角度产生良好反应的能力。,Thurstone(1921):智力是抑制本能反应,灵活地想象不同反应,并且把修改后的本能反应转换为外显行为的能力。Wechsler(1939):智力是个体有目的地行动,理性地思考以及有效地应付环境的总体能力。Piaget(1972):智力是总括性的术语,指用来适应物理和社会环境的认知结构的组织和平衡的高级形式。Sternberg(1985):智力是指自动信息加工和产生适合于新情况的行为的心理能量,它包括元成分、操作成分和知识获得成分。Eysenck(1986):智力是将信息无错地传递过皮层的能力。Gardner(1986):智力是解决问题,制造在某些文化范围内有价值的产品的能力或技术。,共同点:w 智力是适应环境的能力w 智力是通过经验进行学习的能力 智力是人们在获得知识和运用知识解决实际问题时所必须具备的心理条件或特征。Boring(1923):智力就是智力测验所测量的东西。Sternberg等(1981)的研究专家认为:语词能力、问题解决能力和实际智能最重要外行认为:实际问题解决能力、语词能力和社会能力最重要,(二)智力的理论Galton和感觉敏锐度1二因素论 Spearman的一般因素(G)和特殊因素(S)2多因素论Thurstone的群因素(语文理解、言语流畅性、推理、空间想象、数字、记忆、知觉速度),内容 视觉 听觉 符号 语义 行为,3.Guilford的智力结构模型(内容操作结果=150),产品单元类别关系体系转换蕴涵,评价 聚合思维 发散思维 记忆认知 操作,4.智力层次理论Vernon G因素 言语和教育 操作和机械数学 语文 空间知觉 机械能力,5.二维结构模型希莱辛格和古特曼(1966)第一维:言语能力、数学能力、图形和空间能力第二维:规则应用能力、规则归类的能力、学术成就6 Cattell的流体智力与晶体智力7.Gardner的多元智力理论言语、逻辑-数学、空间、音乐、身体运动、社交、自知,8 智力的生物学理论(反应时)作出反应,9 智力的认知心理学理论Sternberg智力成分:元成分、操作成分、知识获得成分智力情境:适应环境、塑造环境、选择新环境智力经验:处理新任务、自动化加工10 其他:情绪智力(EQ)、成功智力、实践性智力(practical intelligence),第二节 个体智力测验一、比内量表(一)比内-西蒙量表11905年量表 世界上第一个智力量表;内容:30道题(记忆、言语、理解、手工操作)。题目排列方式:从易到难。指标:通过项目数。如白痴最多只能通过6项,低能的成人可通过715项。,眼睛是否随动的物体移动。用触觉刺激唤起抓握反应。用视觉刺激唤起抓握反应。辨认食物。搜寻食物。执行简单的命令和模仿简单的手势。认识物体。认识图片。列举图片中的人物和物体。比较两条线的长短。复述两个数字。比较两个重量。暗示。解说物体与人物的名称。复述句子。,说出二物的不同点。记忆图片中的物体。靠记忆重画图片。复述数字。说出二物的相同点。比较线的长短。比较重量。重量记忆。说出同韵字。填词。用三个词造句。对答问句。交换长短针的位置。剪纸。抽象名词的定义。,21908年量表 内容:增至59道题。方式:把测验项目按年龄分组。每一岁一组。每个年龄组项目数量不等,最多8项,最少3项。年龄范围:313岁。指标:智力年龄。,例:一个4岁儿童心理年龄的计算,31911年量表 题目:删旧补新,但总数仍为59题。增设一个成年组。除4岁组仅有4个项目外,其他每个年龄组一律为5项,便于计算。,对比内-西蒙量表的评价 成就:(1)比西量表是第一个采用复杂任务来测量高级心理过程的测验。以前的测验主要测量感知觉、运动等低级心理过程。(2)比西量表首次采用年龄作为智力的标准,这样可以对测验作出通俗易懂的解释。(3)比西量表首次从整体上测量智力,也就是测量智力的普通因素,而以往心理学家把感觉辨别力、记忆力、注意力等割裂开来测量。不足:(1)施测和记分没有标准化。(2)常模团体的代表性不够,因而有些项目的安排位置不当。(3)测验项目过少。,(二)斯坦福-比内量表1斯坦福-比内量表的发展(1)1916年量表 在修改基础上增设39个新项目,达到90个项目。最早对施测和记分提供了详细的指导语。引入了智力商数的概念(比率智商)。适用年龄:313岁。样本:1000名儿童和400名成人。(2)1937年量表 由 L 和 M 两个等值型量表构成 年龄范围扩大:1.518岁 样本:3184名1.518岁儿童,但仅限城市白人,(3)1960年量表 合并了L和M两型中最好的项目,改为单一量表。年龄:2成人 离差智商 4498名1.518岁儿童(1937年量表的施测对象)。(4)1972年量表 测验内容未变;取样范围扩大(地区、社会阶层、经济状况、民族)。共2100名被试,其中25.5岁每半岁选100名,618岁每一岁选100名。,2斯比量表的信度和效度(1)信度 复本信度:L和M相关在0.830.95之间。再测信度:高于0.90。(2)效度 内容效度:测验内容属于公认的智力范畴。效标关联效度:与学业成绩、受教育年限的相关在0.40.75之间。结构效度:假设智力发展随年龄增长,先快后慢(证据:随年龄增长,再测稳定性逐步提高);存在G因素(证据:各项目与测验总分的平均相关为0.66),(三)中国比内测验陆志伟和吴天敏1924年、1936年、1982年三次修订内容:51题指标:离差智商年龄范围:2岁18岁 生活常识 知觉速度及观察力 空间知觉力和想象力 记忆力 语言能力 判断推理能力,二、韦克斯勒(Wechsler)智力测验生平:1896年出生于罗马尼亚,6岁迁居美国。一战期间从事心理测验工作,用陆军甲、乙种测验、斯比量表来甄选新兵,积累了丰富的经验。1919年去伦敦大学,师从Spearman和Pearson,接受G因素理论。19201922年在巴黎与西蒙有过接触。1925年,在哥伦比亚大学获博士学位,论文情绪反应的测量。19321967年,任纽约贝尔韦精神病院的主任心理学家。,二、韦克斯勒(Wechsler)智力测验编制背景:寻找一种测量成人智力的有效方式当时的智力测验存在下列问题:测验项目引不起成人的兴趣;过多的项目涉及语词的操作;指导语过分强调速度,牺牲了准确性;计算心理年龄,不适合成人测验要求。测验者的实际测验分数IQ=这一年龄测验者的平均测验分数,韦氏智力测验家族:1939年,韦克斯勒-贝利弗测验1946年,韦克斯勒-贝利弗测验1949年,韦克斯勒儿童智力量表(WISC)1955年,韦克斯勒成人智力量表(WAIS)1967年,韦克斯勒学前和小学儿童智力量表(WPPSI)1974年,韦克斯勒儿童智力量表修订版(WISC-R)1981年,韦克斯勒成人智力量表修订版(WAIS-R)1989年,韦克斯勒学前和小学儿童智力量表(WPPSI-R)1991年,韦克斯勒儿童智力量表第三版(WISC-),韦氏测验的特点:(1)1012个分测验:使用多个分测验,不仅可以得到总IQ,还可以分析个体在智力上的强项和弱点;(2)言语量表和操作量表各由56个分测验组成,可以单独评价言语或操作的各项智力成分,体现了左右脑功能的整合,而且可以显示个体的职业能力倾向。(3)共同的IQ计分系统:对所有测验和所有年龄组,IQ平均为100,标准差为15。而且每个分测验的平均分为10,标准差接近3分。这样就可以比较被试的各项分测验分数,了解其相对强弱。(4)不同年龄组有相同的分测验:例如,WAIS-R,WISC-R,WPPSI-R有相同的8个核心分测验。这不仅方便施测者,而且有助于测验之间的相互比较。,韦克斯勒测验的分测验(1)常识(information)33个一般知识性问题,如“谁发现了美洲?”“我国的首都在哪里?”“儿童节是哪一天?”得分越高,说明兴趣越广泛,好奇心强,长时记忆好。把该测验放在首位,容易与被试建立关系,不易引起被试的紧张和厌烦。,(2)数字广度(digit span)分顺背和倒背两部分(2位到9位数)。主要测查瞬时记忆能力。对智力低者,测其智力;对智力高者,测其注意力。按0或1计分,总分为两部分之和。智力高者在该项上得分未必高,有时倒背可能会高于顺背成绩。脑功能障碍者一般得分较低。但对有些白痴学者,能轻易得高分。,(3)词汇(vocabulary)要求被试定义和解释通过视觉或听觉呈现给他们的字词的一般意义。例如“什么是杯子?”“什么是美丽?”该测验与抽象概括能力有关。年龄大的、智力高的、受教育程度高的、经历丰富的人,其得分高。问题是计分困难。答案分四级:一级:用同义词,且能说明二者的细微差别;二级:具体运用词汇来造句;三级:望文生义,作字面解释;四级:做手势或指实物给主试看。一级计2分,二级计1分,三四级计0分。,(4)算术(arithmetic)简单项目主要是加减法运算。难一些的问题需要对问题进行分析,并运用两种以上的算术运算。主要测量基本的数理知识和数学思维、推理能力。(5)理解(comprehension)容易的题目主要测常识,如“为什么人要穿衣服?”难的项目需要了解社会、文化传统,如“为什么最高法院任命终身法官?”该分测验能反映被试对于社会价值取向、风俗、伦理道德是否理解和适应,在临床上可以鉴别脑器质性障碍的病人。,(6)类同(similarities)让被试区分物体、事实和观念的重要的相似性与不重要的相似性,如“衬衫和袜子有什么相似的地方?”测查个体的逻辑思维、抽象思维、分析和概括能力。(7)填图(picture completion)要求被试回答图中缺少了什么重要成分。主要测的是记忆、细节注意能力和视觉敏锐性。具有病态观念的患者往往将自己的思想投射到测验中去。智力落后者的填图成绩很差。,(8)图片排列(picture arrangement)有意打乱图片的顺序,要求被试重新排列图片,使之组成一个有意义的故事。测量被试的分析综合能力、观察因果关系的能力、社会计划性、预测能力和幽默感等。,(9)积木图案(block design)呈现10张红白相间的几何图案卡片,要求被试用4个或9个积木照样摆出来。主要测量视知觉、分析能力、空间定向能力和视觉-运动综合协调能力。该测验与操作量表总分相关很高,被认为是最好的操作测验。在临床上帮助诊断知觉障碍、分心、老年衰退等症状。,(10)拼图(object assembly)要求被试把一套切割成几块的图形板,拼成一个熟悉物体的完整画面。测量概括思维能力与知觉组织能力、

    注意事项

    本文(大学心理测量学.ppt)为本站会员(牧羊曲112)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开