欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPTX文档下载  

    心理测量学理论(“测验”有关文档)共163张.pptx

    • 资源ID:1717021       资源大小:2.67MB        全文页数:164页
    • 资源格式: PPTX        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    心理测量学理论(“测验”有关文档)共163张.pptx

    心理测量学理论(“测验”有关文档)共163张,心理测量学理论(“测验”有关文档)共163张,关于测量,物理测量:长度、重量、面积、速度等。生理测量:生化成分、生理机能等。社会测量:人口普查、经济统计、民意调查等。心理测量:智力、人格、成就、职业兴趣、态度等。,关于测量物理测量:长度、重量、面积、速度等。,在心理咨询与治疗过程中,无论是临床诊断,还是疗效评估,心理测量都是重要的手段。因此,心理咨询师有必要了解心理测量的理论与技术。,在心理咨询与治疗过程中,无论是临床诊断,还是疗效评估,心理测,第一节 概述第二节 测验的常模 第三节 测验的信度第四节 测验的效度第五节 项目分析第六节 测验编制的一般程序第七节 心理测验的使用,第一节 概述,第一节 概 述,第1单元 测量与测量量表 第2单元 心理测量的基本概念 第3单元 心理测验的分类 第4单元 纠正错误的测验观第5单元 心理测验在心理咨询中的应用 第6单元心理测量的发展史,第一节 概 述第1单元 测量与测量量表,第一单元 测量与测量量表,一、什么是测量测量就是依据一定的法则用数字对事物加以确定。测量包括3个元素:事物、数字与法则。事物:就是我们要测量的对象。数字:代表某一事物或该事物某一属性的量。数字具有区分性、序列性、等距性和可加性。法则:是指测量所依据的规则和方法。,第一单元 测量与测量量表一、什么是测量,二、测量要素任何测量都具有两个要素:参照点和单位(一)参照点要确定事物的量,必须有一个计算的起点,这个起点就叫参照点。参照点有两种:一是绝对零点(重量、长度);二是相对零点(人为确定的参照点,如温度、海拔高度)。(二)单位单位是测量的基本要求,没单位就无法进行测量。好的单位必须具备两个条件:一是有确定的意义(cm、kg);二是有相同的价值(1cm-2cm-3cm)。,二、测量要素,年5月多选题:任何测量都应该具备的要素是( )(A)量表 (B)参照点 (C)等级 (D)单位(BD),年5月多选题:,三、测量量表 斯蒂文斯将测量从低级到高级分成四种水平,即命名量表、顺序量表、等距量表和等比量表。,三、测量量表,(一)命名量表 命名量表是测量水平最低的一种量表,只是用数字来代表事物或把事物归类。可分为两种:代号:用数字来代表个别事物,如学生和运动员的编号等。类别:用数字来代表具有某种属性的事物的全体,如用1代表男、用2代表女,或用不同数字代表不同职业等。 命名量表的特点:无大小之分、无零点、无单位、不能运算,(一)命名量表,(二)顺序量表顺序量表比命名量表水平高,其中的数字不仅指明类别,同时也指明类别的大小或含有某种属性的程度。如:考试名次、工资级别等,主要用于分等级或排出顺序。特点:无相等单位、无绝对零点、数字仅表示等级、不能运算。,(二)顺序量表,(三)等距量表特点:有大小关系、有相等单位,数值可以进行加减运算,由于没有绝对零点,不能做乘除运算。比如,0C温度并不意味着没有温度。,(三)等距量表,(四)等比量表等比量表是最高水平的量表。 特点:有相等的单位,有绝对零点、其数值可以进行加、减、乘、除运算。 如:长度、重量、时间等。,(四)等比量表,一般来说,心理测量是在顺序量表上进行的,因为对于人的智力、性格、兴趣、态度等来说,绝对零点是难以确定的。,一般来说,心理测量是在顺序量表上进行的,因为对于人的智力、性,第二单元 心理测量的基本概念,一、心理测量的定义所谓心理测量,就是依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点做出推论和数量化分析的一种科学手段。(应对问卷:10.常常喜欢找人聊天以减轻烦恼 ),第二单元 心理测量的基本概念一、心理测量的定义,年5月单选题:心理测验的行为样本必须具有( )。A、全国性B、区域性C、代表性D、整群性 ( C ),年5月单选题:,二、心理测验的性质(一)间接性(通过外显行为推论心理特质)(二)相对性(如智力高低、兴趣大小)(三)客观性 心理测量的客观性实际上就是测验的标准化问题,包括:测验的刺激是客观的对反应的量化是客观的对结果的推论是客观的,二、心理测验的性质,第三单元 心理测验的分类,一、按测验的功能分类(一)智力测验 是对一般能力的测验(观察力、记忆力、想象力、思维力、注意力),比如:比内-西蒙智力测验、韦克斯勒智力量表。(二)特殊能力测验 如音乐、绘画等才能的测验。(三)人格测验 用于测量性格、气质、兴趣、情绪、动机、信念等,如16PF。 21.我对于人或物的兴趣都很容易改变: A.是的 B.介乎A与C之间 C.不是的,第三单元 心理测验的分类 一、按测验的功能分类,二、按测验材料的性质分类(一)文字测验(二)操作测验(非文字测验),二、按测验材料的性质分类,心理测量学理论(“测验”有关文档)共163张,三、按测验材料的严谨程度分类(一)客观测验(二)投射测验 包括罗夏墨迹测验、主题统觉测验、自由联想测验、句子完成测验等。,三、按测验材料的严谨程度分类,夏墨迹测验,夏墨迹测验,主题统觉测验,主题统觉测验,心理测量学理论(“测验”有关文档)共163张,心理测量学理论(“测验”有关文档)共163张,四、按测验的方式分类(一)个别测验(二)团体测验,四、按测验的方式分类,五、按测验的要求分类(一)最高行为测验(智力测验、成就测验)(二)典型行为测验(人格测验),五、按测验的要求分类,第四单元 纠正错误的测验观,一、错误的测验观(一)测验万能论(二)测验无用论(三)心理测验即智力测验,第四单元 纠正错误的测验观一、错误的测验观,二、正确的测验观(一)心理测验是重要的心理学研究方法之一,是决策的辅助工具。(二)心理测验作为研究方法和测量工具尚不完善。,二、正确的测验观,第五单元 心理测验在心理咨询中的应用,目前,在我国心理门诊中运用较多的大致有3类心理测验:智力测验人格测验心理评定量表(精神病评定量表、抑郁量表等)心理测验在心理咨询与治疗过程中并不是必不可少的,如果通过与来访者的交谈,对其问题已形成明确的看法,就应放弃不必要的心理测验。,第五单元 心理测验在心理咨询中的应用 目前,在我国心理门,第六单元心理测验的发展史,一、科学心理测验的产生与发展首先倡导科学心理测验的学者是英国生物学家和心理学家高尔顿,他提出人的不同气质特点和智能是按身体特点的不同而遗传的。为了研究个体差异的遗传性,他设计了测量差异的方法,为心理测验奠定了统计学基础。他第一个提出了相关的概念。(价值观与幸福感的关系),第六单元心理测验的发展史一、科学心理测验的产生与发展,年11月单选题:首先倡导科学心理测验的学者是( )。A、比内B、高尔顿C、卡特尔D、皮尔逊 ( B ),年11月单选题:,另一位对促进心理测验发展做出巨大贡献的是 心理学家卡特尔,他于1890年在心理杂志上发表“心理测验与测量”一文,这是心理测验第一次出现于心理学文献中。他强调:“心理学若不立足于实验与测量上,绝不能够有自然科学之准确性。”、“心理测验如果有一个普遍的标准,则其科学的与实用的价值都可以增加。”,另一位对促进心理测验发展做出巨大贡献的是 心理学家卡特尔,,法国心理学家比内与助手西蒙于1905年发表了题为“诊断儿童智力的新方法”的文章,介绍了一个包括30个项目的量表,这个量表是世界上第一个正式的心理测验。,法国心理学家比内与助手西蒙于1905年发表了题为“诊断儿童智,20世纪以后,心理测验主要有四个方面的发展:1、操作测验的发展(尤其适用于不识字者)2、团体智力测验的发展(用于官兵选拔和分派兵种)3、能力倾向测验的发展(韦克斯勒智力量表)4、人格测验的发展(MMPI、16PF、EPQ等),20世纪以后,心理测验主要有四个方面的发展:,二、现代心理测验在我国的发展 我国近代心理测验大约源于1914年前后。 近年来,我国心理学家正在致力于心理测验的本土化,编制适合我国文化背景的智力测验、适应行为量表等。 (王登峰:大七人格),二、现代心理测验在我国的发展,第二节 测验的常模,第一单元 常模团体第二单元 常模的类型第三单元 常模分数的表示方法,第二节 测验的常模第一单元 常模团体,什么是常模?常模是指一定人群在测验所测特性上的普遍水平。 常模,就是常人的样子。,什么是常模?,补充:常模参照与标准参照采用常模参照分数解释的测验:如律师资格考试,即使大家考试都考得特别好,也只取前面的百分之几。采用标准参照分数解释的测验:如心理咨询师资格的考试,包括基础理论和操作技能,满分都是一百,六十分及格。两科都满60,就能通过。通过与不通过,参照一个事先设定好的标准来解释分数,就叫做标准参照分数解释。,补充:常模参照与标准参照,第一单元 常模团体,一、常模团体的性质常模团体是由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。对测验编制者而言,在确定常模团体时,需要先确定一般总体,再确定目标总体,最后确定样本。,第一单元 常模团体一、常模团体的性质,二、常模团体的条件(一)群体的构成必须明确界定(性别、年龄、职业)(二)常模团体必须是所测群体的代表性样本(三)样本的大小要适当 在实际工作中,应从经济、实用和减少误差两方面来综合考虑样本的大小。如果总体数目大,样本一般最低不小于30或100个。全国性常模,一般应有2000-3000人为宜。(四)标准化样组是一定时空的产物/具有新近性,二、常模团体的条件,年11月多选题: 常模团体的条件有( )。 A、群体构成明确B、样本具有代表性C、样本大小适当D、具有新近性 ( ABCD ),年11月多选题:,这种比较包括两个人不同分数的差别和同一被试在两个测验上的差别。由于人的大多数心理特性呈常态分布,所以项目难度的分布也以常态分布为好,即特别难与特别易的项目少些,接近中等难度的项目多些,使所有项目的平均难度为050。这就是说,大约有95%的可能性真分数落在所得分数的范围内,或有5%的可能性落在范围之外。常用作特殊能力测验的中间效标(1)相容效度是构思效度的一个证据。(二)相对性(如智力高低、兴趣大小)b、接受测验的团体的特点。人的许多心理特质,如智力、技能等,是随着时间有规律地发展的,因此可以将个人的成绩与各种发展水平的人的平均表现相比较。评分者信度用于测量不同评分者之间所产生的误差。因此,85的百分等级表示在常模样本中有85%的人比这个分数要低。测量的效度除受随机误差影响外,还受系统误差的影响。如在韦氏智力测验中,通常是用测得的IQ值加减5(可信限水平 85%90%)的方法判断IQ值的波动范围,若测得某被试的IQ值为105时,他的IQ便在100110的范围内变化。离差智商是一种以年龄组为样本计算而得到的标准分数,为使其与传统的比率智商基本一致,韦克斯勒将离差智商的平均数定为100,标准差定为15。效标必须能最有效地反映测验的目标,即效标测量本身必须有效;常模资料,包括常模表、常模适用的团体及对测验分数如何做解释。最常用的方法是请有关专家对测验题目与原定内容的符合性做出判断,看测验的题目是否代表规定的内容。,三、取样的方法取样就是从目标人群中选择有代表性的样本。 取样方法有:(一)简单随机抽样(二)系统抽样(三)分组抽样(四)分层抽样,这种比较包括两个人不同分数的差别和同一被试在两个测验上的差别,简单随机抽样就是按照随机表顺序选择受测者构成样本,或者将抽样范围内的每个人或每个抽样单位进行编号,再随机选择。(随机表=乱数表)系统抽样又称等距抽样,就是将已编好号码的个体排成顺序,然后每隔若干个号码抽取一个。分组抽样是先将群体进行分组,再在组内进行随机取样。分层抽样是先将目标总体按某种变量(如年龄、性别等)分成若干层次,再从各层次中抽取若干受测者,最后把各层的受测者组合成常模样本。,简单随机抽样就是按照随机表顺序选择受测者构成样本,或者将抽样,四、常模与常模分数(一)常模常模是一种供比较的标准量数,是心理测验时用于比较和解释测验结果的参照分数标准。按照样本大小和来源,常模可分为全国常模、区域常模和特殊常模。(二)常模分数常模分数就是施测常模样本后,将受测者的原始分数按一定规则转换出来的导出分数。导出分数具有一定的参照点和单位,是一个有意义的测验量表,与原始分数等值,可以进行比较。,四、常模与常模分数,一、发展常模 人的许多心理特质,如智力、技能等,是随着时间有规律地发展的,因此可以将个人的成绩与各种发展水平的人的平均表现相比较。根据这种平均表现所制成的量表就是发展常模,亦称年龄量表。在年龄量表中,个人的分数表明他的行为按正常途径发展处于什么样的发展水平。,第二单元 常模的类型,一、发展常模 第二单元 常模的类型,(一)发展顺序量表发展顺序量表告诉人们多大的儿童具备什么能力或行为就表明其发育正常,相应能力或行为早于某年龄出现,说明发育超前,否则即为发育滞后。 (三翻六坐九爬),(一)发展顺序量表,心理测量学理论(“测验”有关文档)共163张,发展顺序量表最早的一个范例是格塞尔发展程序表,按月份显示儿童在运动水平、适应性、语言、社会性四个方面的大致发展水平。在儿童发展方面,瑞士心理学家皮亚杰最著名的工作就是对守恒概念的研究。皮亚杰发现,儿童在不同时期出现不同的守恒概念,通常儿童到5岁时才会理解质量守恒(橡皮泥);6岁时才会掌握重量守恒(杯中水);7岁时才具有容量守恒概念。,发展顺序量表最早的一个范例是格塞尔发展程序表,按月份显示儿童,(二)智力年龄比内-西蒙量表中首先使用智力年龄的概念。一个儿童在年龄量表上所得的分数,就是最能代表他智力水平的年龄。这种分数叫做智力年龄,简称智龄。计算方法: 在吴天敏修订的比内-西蒙量表中,每个年龄都有6个测题,答对每题则得智龄2个月。假如某儿童6岁组的题目全部通过,7岁组通过4题,8岁组通过3题,9岁组通过2题,其智龄为:6(岁)+42(月)+32(月)+22(月)=6岁+18月=7岁6个月。,(二)智力年龄,(三)年级当量年级当量实际上就是年级量表,测验结果说明属哪一年级的水平,在教育成就测验中最常用。其表达方式常是:某学生的算术是6年级水平,阅读是4年级水平、理解是5年级的水平。如常模样本中6年级的算术平均分为35,某儿童在算术测验中也得35分,那么,该儿童的算术能力是6年级水平。,(三)年级当量,二、百分位常模百分位常模包括百分等级和百分点、四分位数和十分位数。,二、百分位常模,(一)百分等级是应用最广的表示测验分数的方法。 一个测验分数的百分等级是指在常模样本中低于这个分数的人的百分比。因此,85的百分等级表示在常模样本中有85%的人比这个分数要低。,(一)百分等级,(二)百分点也叫百分位数,是计算处于某一百分比例的人对应的测验分数是多少。在分数量表上,相对于某一百分等级的分数点就叫百分点或百分位数。在实际应用中,一般既可以由原始分数计算百分等级,也可以由百分等级确定原始分数。通过这样的双向方式编制的原始分数与百分等级对照表,就是百分位常模。,(二)百分点,(三)四分位数和十分位数四分位数和十分位数只是百分位数的两个变式,其含义相似。百分位数是将量表分成100份,而四分位数是将量分成四等份,相当于百分等级的25%、50%和75%对应的三个百分点分成的四段。十分位数也可以依此类推出,1%-10%为第一段,91%-100%为第十段。,(三)四分位数和十分位数,三、标准分常模标准分常模是将原始分数与平均数的距离以标准差为单位表示出来的量表。因为它的基本单位是标准差,所以叫标准分数。 (标准差:各数据偏离平均数的距离的平均数。)标准分数可通过线性转换,也可通过非线性转换得到。,三、标准分常模,(一)线性转换的标准分数z分数是典型的线性转换的标准分数,原始分转换为标准分数的公式: z=(X-X)/SD 其中,X为任一原始分数,X为样本平均数,SD为样本标准差。 由于z分数中经常出现小数点和负数,且单位过大,计算和使用不方便,因此通常将z分数转换为: Z=A+Bz 其中,Z为转换后的标准分数,A、B为根据需要指定的常数。加上一个常数是为了去掉负值,乘以一个常数是为了使单位变小从而去掉小数点。,(一)线性转换的标准分数,常见的标准分数有: T分数、标准九分、标准十分、标准二十分、离差智商等。T 分数是以50为平均数,以10为标准差;标准九分是以5为平均数,以2为标准差;标准十分是以为平均数,以为标准差;标准二十分是以10为平均数,以3为标准差;使用最广、影响最大的离差智商是以100为平均数,以15为标准差。,常见的标准分数有: T分数、标准九分、标准十分、标准二十分、,(二)非线性转换的标准分数 当原始分数不是常态分布时,也可以通过非线性转换使之常态化。常态化过程主要是将原始分数转化为百分等级,再将百分等级转化为常态分布上相应的标准分数。,(二)非线性转换的标准分数,四、智商及其意义在比内-西蒙智力测验中,是用“心理年龄” 来表示智力高低。若一个儿童心理年龄高于其生理年龄,则智力较一般儿童高;如果心理年龄低于其生理年龄, 则智力较一般儿童低。但在使用中发现,单纯用心理年龄来表示智力高低的方法缺乏不同年龄儿童间的可比性。于是提出了比率智商和离差智商。,四、智商及其意义,(一)比率智商(IQ)比率智商被定义为心理年龄(MA)与实足年龄(CA)之比。为避免小数,将商数乘以100,公式为:IQ=MA/CA100由于个体智力增长是一个由快到慢再到停止的过程,即心理年龄与实足年龄并不同步增长,所以比率智商并不适合于年龄较大的被试。 (IQ=MA/CA100=20/40100=50),(一)比率智商(IQ),(二)离差智商离差智商是一种以年龄组为样本计算而得到的标准分数,为使其与传统的比率智商基本一致,韦克斯勒将离差智商的平均数定为100,标准差定为15。所以离差智商建立在统计学的基础上,表示的是个体智力在年龄组中所处的位置,因而是表示智力高低的一种理想的指标, 公式为: IQ=100+15(X-X)/SD 注意:从不同的测验获得的离差智商只有当标准差相同或接近时才可以比较。,(二)离差智商,专栏5-2 几种导出分数间的相互关系的z分数,60分的T分数,在韦氏测验中115分的离差智商分数,相当于84的百分等级。 (见P368图),专栏5-2 几种导出分数间的相互关系,第三单元 常模分数的表示方法,一、转换表法最简单而且最基本的表示常模的方法就是转换表,也叫常模表。测验的使用者利用转换表可将原始分数转换为与其对应的导出分数,从而对测验的分数作出有意义的解释。简单的转换表/常模表就是将单项测验的原始分数转换成一种或几种导出分数;复杂的转换表/常模表通常包括几个分测验或几种常模团体的原始分数与导出分数的对应关系。,第三单元 常模分数的表示方法一、转换表法,二、剖面图法 剖面图就是将测验分数的转换关系用图形表示出来,从剖面图上可以很直观地看出被试在各个分测验上的表现及其相对的位置。,二、剖面图法,16PF:乐群性(A)、聪慧性(B)、稳定性(C)、恃强性(E)、兴奋性(F)、有恒性(G)、敢为性(H)、敏感性(I)、怀疑性(L)、幻想性(M)、世故性(N)、忧虑性(O)、实验性(Q1)、独立性(Q2)、自律性(Q3)、紧张性(Q4)。,16PF:乐群性(A)、聪慧性(B)、稳定性(C),第三节 测验的信度,第三节 测验的信度信度的概念1信度评估的方法2信,第一单元 信度的概念,一、信度的定义 信度是指同一被试者在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。 信度只受随机误差的影响。随机误差越大,信度越低。 系统误差产生恒定效应,不影响信度。随机误差:由与测量目的无关的、偶然的因素引起,而又不易控制误差,使多次测量产生了不一致的结果,其方向和大小变化是完全随机的。 系统误差:由与测量目的无关的变因引起的一种恒定而有规律的效应。这种误差稳定地存在于每一次测量之中,此时尽管多次测量的结果非常一致,但实测结果仍旧与真实数值有所差异,是不正确的。,第一单元 信度的概念,二、信度的指标1.信度系数与信度指数 大部分情况下,信度是以信度系数为指标,它是一种相关系数。 有时也用信度指数作为信度的指标。信度指数的平方就是信度系数。2.测量标准误 在测量标准误的公式中(公式5-5),rxx是测验的信度系数。测量的标准误与信度之间有互为消长的关系:信度越高,标准误越小;信度越低,标准误越大。 不同的信度反映测验误差的不同来源。,二、信度的指标,第二单元 信度评估的方法,一、重测信度重测信度又称稳定性系数。它的计算方法是采用重测法,即使用同一测验,在同样条件下对同一组被试前后施测两次,求两次得分间的相关系数。人的多数心理特征,如智力、性格、兴趣等,具有相对的稳定性,间隔一段时间不会有很大变化。重测最适宜的时距随测验的目的、性质和被试的特点而异,一般是两周到四周较宜,间隔时间最好不超过六个月。,第二单元 信度评估的方法一、重测信度,二、复本信度复本信度又称等值性系数,是以两个等值但题目不同的测验来测量同一群体,然后求得被试者在两个测验上得分的相关系数。复本信度反映的是测验在内容上的等值性。复本信度也要考虑两个复本实施的时间间隔。如果两个复本几乎是在同一时间内施测的,相关系数反映的才是不同复本的关系。如果两个复本的施测相隔一段时间,则称重测复本信度或稳定与等值系数。,二、复本信度,年5月多选题: 如果两个复本的施测相隔一段时间,则其信度称为( ) (A)重测复本信度 (B)重测信度 (C)复本信度 (D)稳定与等值系数 (AD),年5月多选题:,复本信度的优点是能够避免重测信度的一些问题,如记忆效果、学习效应等,但也有其局限性:其一,如果测量的行为易受练习的影响,则复本信度只能减少而不能完全消除这种影响;其二,由于第二个测验只改变了题目的内容,已经掌握解题原则,可以很容易地迁移到同类问题上去;其三,对于许多测验来说,建立复本是十分困难的。,复本信度的优点是能够避免重测信度的一些问题,如记忆效果、学习,三、内部一致性信度(一)分半信度分半信度指采用分半法估计所得的信度系数。通常是在测验实施后将测验按项目编号的奇数、偶数分为等值的两半,并分别计算每位受测者在两半测验上的得分,求出这两半分数的相关系数。这个相关系数就代表了两半测验内容取样的一致程度。(二)同质性信度同质性主要代表测验内部所有题目间的一致性。当各个测题的得分有较高的正相关时,不论题目的内容和形式如何,其测验为同质的。相反,即使所有题目看起来好像测量同一特质,但相关很低或为负相关时,其测验为异质的。,三、内部一致性信度,四、评分者信度 评分者信度用于测量不同评分者之间所产生的误差。通常是随机抽取若干份测验卷,由两位评分者按评分标准分别给分,然后再根据每份测验卷的两个分数计算相关,即得评分者信度。一般要求在成对的受过训练的评分者之间平均一致性达以上,才认为评分是客观的。,四、评分者信度,第三单元 信度与测验分数的解释,一、解释真实分数与实得分数的相关 在极端的情况下,如有rxx,则表示完全没有测量误差,所有的变异均来自真实分数;若有rxx0,则所有的变异和差别都反映的是测量误差。,第三单元 信度与测验分数的解释一、解释真实分数与实得分数,二、确定信度可以接受的水平 一个测验究竟信度多高才适合,一般原则是:当rxx 时,测验因不可靠而不能用;当0.70 rxx 时,可用于团体比较;当rxx 时,才能用来鉴别或预测个人成绩或作为。,二、确定信度可以接受的水平,三、解释个人分数的意义信度在解释个人分数上的意义,是通过测量标准误这一概念去体现的。主要体现在两方面:一是估计真实分数的范围;二是了解实得分数再测时可能的变化情形。人们一般采用95%的概率水平,其置信区间为:XT 这就是说,大约有95%的可能性真分数落在所得分数的范围内,或有5%的可能性落在范围之外。,三、解释个人分数的意义,四、比较不同测验分数的差异测量标准误和测验信度在评价两个不同测验的分数是否有明显差异时也非常重要。这种比较包括两个人不同分数的差别和同一被试在两个测验上的差别。这就是差异分数的标准误问题(公式5-8)。如果某被试在韦氏成人智力测验中言语智商为102,操作智商为110。已知两个分数都是以100为平均数,15为标准差的标准分数。假设言语测验和操作测验的分半信度分别为和。不能认为其操作智商显著高于言语智商。,四、比较不同测验分数的差异,第四单元 影响信度的因素,一、样本特征(一)样本团体异质性的影响 一般而言,若获得信度的取样团体较为异质的话,往往会高估测验的信度,相反则会低估测验信度。(二)样本团体平均能力水平的影响 对于不同水平的团体,题目具有不同的难度,每个题目在难度上的微小差异累计起来便会影响信度。,第四单元 影响信度的因素一、样本特征,二、测验长度 一般来说,在一个测验中增加同质的题目,可以使信度提高。 测验越长,测验的测题取样或内容取样越有代表性。测验越长,被试的猜测因素影响就越小。 但是,测验过长有时反而会引起被试的疲劳和反感而降低可靠性。(MMPI,566),二、测验长度,三、测验难度难度对信度的影响,只存在于某种测验中,如智力测验、成就测验、能力倾向测验等,对于人格测验、兴趣测验、态度量表等不存在难度问题,因为这些测验的题目没有正确或错误答案之分。,三、测验难度,四、时间间隔 以再测法或复本法求信度,两次测验相隔时间越短,其信度系数越大;间隔时间越久,其他变因介入的可能性越大,受外界的影响也越大,信度系数就越低。,四、时间间隔,专栏5-3 信度的特殊问题对于速度测验,不存在评分者信度,也无法计算同质性信度,而重测信度和复本信度均可按传统的方法求得,只有分半信度不可用传统方法估计。 由于信度与测验长度有关,当一个测验有几个分测验时,分测验的分数与合成分数相比不如合成分数可靠。,专栏5-3 信度的特殊问题,第四节 测验的效度,第四节 测验的效度效度的概念1效度评估的方法2效度的功能3,第一单元 效度的概念,一、效度的定义在心理测验中,效度是指所测量的与所要测量的心理特点之间符合的程度,或者简单地说是指一个心理测验的准确性。测量的效度除受随机误差影响外,还受系统误差的影响。可信的测验未必有效,有效的测验必定可信。,第一单元 效度的概念一、效度的定义,二、效度的性质(一)相对性 任何测验的效度都是对一定的目标来说的,或者说测验只有用于和测验目标一致的目的与场合才会有效。在评鉴测验的效度时,必须考虑其目的与功能。(二)连续性 测验效度通常用相关系数表示,它只有程度上的不同,而没有“全有”或“全无”的区别。,二、效度的性质,专栏5-4 信度与效度的关系一、信度是效度的必要而非充分条件二、效度受信度制约,专栏5-4 信度与效度的关系,在比内-西蒙智力测验中,是用“心理年龄” 来表示智力高低。一般来说,适度的焦虑会使人的兴奋性提高,注意力增强,提高反应速度,从而提高智力测验、成就测验和能力倾向测验的成绩。我对于人或物的兴趣都很容易改变:5“是”、“非”题的数目应有适应比例,基本相等,且要随机排列。物理测量:长度、重量、面积、速度等。这个相关系数就代表了两半测验内容取样的一致程度。特点:有相等的单位,有绝对零点、其数值可以进行加、减、乘、除运算。b选项切忌冗长,要简明扼要。只有对受测者的年龄、受教育程度和社会经济状况以及阅读水平等做到心中有数,编制测验时才能有的放矢。(二)相对性(如智力高低、兴趣大小)一般地说,测验的用途可分两类:显示和预测,由此可将心理测验分为两类:显示性测验和预测性测验。第二节 测验的常模各选项长度应相等,尽量不要有长有短。一、应试技巧与练习效应(1)相容效度是构思效度的一个证据。主要用工作评定,操作有一定难度项目区分度也叫鉴别力,是指测验项目对受测者的心理特性的区分能力。,第二单元 效度的评估方法,心理学会于1974年所发行的教育与心理测量之标准一书中将效度分三大类:内容效度、构想效度、效标效度。,在比内-西蒙智力测验中,是用“心理年龄” 来表示智力高低。第,一、内容效度(一)什么是内容效度 内容效度指的是测验题目对有关内容或行为取样的适用性,即该测验是否是所要测量的行为领域的代表性取样。(胜任特征),一、内容效度,(二)内容效度的评估方法1、专家判断法 最常用的方法是请有关专家对测验题目与原定内容的符合性做出判断,看测验的题目是否代表规定的内容。如果专家认为测验题目恰当地代表了所测的内容,则测验具有内容效度。由于这种估计效度的方法,是一个逻辑分析的过程,所以内容效度有时又称“逻辑效度”。,(二)内容效度的评估方法,为了使内容效度的确定过程更为客观,弥补不同专家对同一测验的判断可能出现的不一致,可采用以下几个步骤: 定义好测验内容的总体范围 编制双向细目表 制定评定量表来测量测验的整个效度,为了使内容效度的确定过程更为客观,弥补不同专家对同一测验,年5月多选题: 为了使内容效度的确定过程更为客观,弥补不同专家对同一测验的判断可能的不一致,可采用的步骤是( ) (A)定义好测验内容的总体范围 (B)编制双向细目表 (C)制定评定量表来测量测验的整体效度 (D)进行统计分析 (ABC),年5月多选题:,2、统计分析法 除了描述性语言外,内容效度的确定也可采用一些统计分析方法。例如计算两个评分者之间的评定的一致性;还可以通过计算复本相关和再测法来评估内容效度。 3、经验推测法 通过实践来检验效度。,2、统计分析法,(三)内容效度的特性 内容效度经常与表面效度混淆。表面效度是由外行对测验作表面上的检查确定的,它不反映测验实际测量的东西,只是指测验表面上看来好像是测量所要测的东西;而内容效度是由够资格的判断者(专家)详尽地、系统地对测验作评价而建立的。 在编制测验时,表面效度是一个必须考虑的特性。比如最高行为测验就要求有较高的表面效度。,(三)内容效度的特性,二、构想效度(一)什么是构想效度 构想效度也叫构思效度或结构效度,是指测验能够测量到理论上的构想或特质的程度,即测验的结果是否能证实或解释某一理论的假设、术语或构想,解释的程度如何。,二、构想效度,(二)构想效度的评估方法 1.对测验本身的分析 可作为构想效度的测验内部证据包括:测验的内容效度、测验的内部一致性指标、分析受测者对题目的反应特点。,(二)构想效度的评估方法,2.测验间的相互比较 最简单的是计算两种测验之间得分的相关,其中一个测验是研究效度的,另一个是已有效度证据的成熟的测验,但两者测量的是同一种心理特质。假如相关高,说明新测验所测量的特质确实是老测验所反映的特质或行为。两测验的相关系数称为相容效度。(1)相容效度是构思效度的一个证据。(2)区分效度是构思效度的又一个证据。(3)因素分析法是建立构思效度的常用方法。3.效标效度的研究证明(智力测验分数是否随年龄增长而增高)4.实验法和观察法证实(共情能力在训练前后是否有变化),2.测验间的相互比较,三、效标效度(一)什么是效标效度 效标效度又称实证效度,反映的是测验预测个体在某种情境下行为表现的有效性程度。可分为同时效度和预测效度两类。 被预测的行为是检验效度的标准,简称效标。,三、效标效度,常用效标 学业成就常用作智力测验和标准化成就测验的效标主要有在校成绩、学历、获奖情况、教师评定等工作表现常用作特殊能力测验及部分智力和人格测验的效标主要用工作评定,操作有一定难度团体差异以测验是否能够区分团体差别作为效标,常用效标,临床诊断常用作人格测验的效标特殊训练成绩常用作特殊能力测验的中间效标主要是特殊训练的表现等级评定常用作人格测验的效标由被试的家长、同学、老师、同事对其心理进行评价现有测验现有的效度得到公认的同类测验可以作为新测验的效标,临床诊断,一个好的效标必须具备以下条件: 效标必须能最有效地反映测验的目标,即效标测量本身必须有效; 效标必须具有较高的信度,稳定可靠,不随时间等因素而变化; 效标可以客观地加以测量,可用数据或等级来表示; 效标测量的方法简单,省时省力,经济实用。,一个好的效标必须具备以下条件:,(二)效标效度的评估方法 1、相关法 相关法是评估效标效度最常用的方法,是求测验分数与效标资料间的相关,这一相关系数称为效度系数。 计算效度系数最常用的是积差相关法,在特殊情况下可采用点二列相关公式或二列相关公式 、贾期朋多系列相关公式 。,(二)效标效度的评估方法,2、区分法 区分法是检验测验分数能否有效地区分由效标所定义的团体的一种方法。3、命中率法 命中率法是当测验用来做取舍的依据时,用其正确决定的比例作为效度指标的一种方法。 用某个测验(量表)来做预测(决定)可能出现四种情况:预测成功而且实际也成功;预测成功但实际上失败;预测失败实际上成功;预测失败实际也失败。正确的预测(决定)就称为“命中”,不正确的预测(决定)就是失误。,2、区分法,年11月单选题: 当测验用来做取舍的依据时,用其正确的比例作为效度指标的方法是( )。(A)相关法(B)区分法(C)命中率法(D)因素分析法 (C),年11月单选题:,第三单元 效度的功能,一、预测误差效度系数的实际意义通常以决定性系数来表示。决定性系数是效度系数的平方,例如:测验的效度是0.80,决定性系数是,即测验分数正确预测效标的比例是64%,其余36%无法做出正确的预测。在公式5-11中,rxy2代表效度系数的平方,即决定系数。 二、预测效标分数(公式5-12)三、预测效率指数(公式5-14),第三单元 效度的功能一、预测误差,一、测验本身的因素 测验取材的代表性、测验长度、试题类型、难度、区分度以及编排方式等都会影响效度。 要保证测验具有较高的效度,要做好以下几点: 1、测验材料必须对整个内容具有代表性 2、测题设计时应尽量避免容易引起误差的题型(如是非题) 3、测题难度要适中,具有较高的区分度 4、测验长度要恰当,要有一定的测题量 5、测题的排列按先易后难的顺序,第四单元 影响效度的因素,一、测验本身的因素第四单元 影响效度的因素,二、测验实施中的干扰因素主测者/主试的影响受测者/被试的影响三、样本团体的性质(一)样本团体的异质性 如果其他条件相同,样本团体越同质,分数分布范围越小,测验效度就越低;样本团体越异质,分数分布范围越大,测验效度就越高。,二、测验实施中的干扰因素,(二)干涉变量 对于不同性质的团体,同一测验的效度会有很大的不同。这些性质包括:年龄、性别、教育水平、智力、动机、兴趣、职业和任何其他有关特征。由于这些特征的影响,使得测验对于不同的团体具有不同的预测能力,故测量学上称这些特征为干涉变量。 心理学家吉赛利提出了一套确定干涉变量的方法: 用回归方程求得每个人的预测效标分数,将该分数与实际效标分数比较,获得差异分数D。如果D的绝对值很大,说明测验中可能存在干涉变量。 根据样本团体的组成分析,找出对照组,分别计算效度,找出干涉变量。 对于欲测团体,根据某些易见的干涉变量将其区分为预测性高和预测性低的两个亚团体。对于预测性高的团体,获得的测验效度会有所提高 。,(二)干涉变量,四、效标的性质 效标测量本身的可靠性如何是一个值得考虑的问题。效标测量的可靠性就是效标测量的信度。,四、效标的性质,一般来说,测验的项目分析包括定性分析和定量分析两个方面。定性分析包括考虑内容效度、题目编写的恰当性和有效性等;定量分析主要指对题目难度和区分度等进行分析。通过项目分析,可以选择和修改测验题目,以提高测验的信度和效度。,第五节 项目分析,一般来说,测验的项目分析包括定性分析和定量分析两个方面。,第一单元 项目的难度,一、项目难度的定义难度就是指项目的难易程度。在能力测验中通常需要一个反映难度水平的指标,在非能力测验(如人格测验)中,类似的指标是“通俗性”。难度的指标通常以通过率表示,即以答对或通过该题的人数百分比来表示: 其中,P代表项目的难度,N为全体被试者人数,R为答对或通过该项目的人数。以通过率表示难度时,通过人数越多(即P值越大),难度越低;P值越小,难度越高。,第一单元 项目的难度一、项目难度的定义,二、项目难度的计算方法(一)二分法记分的项目心理测验的项目大多为选择题,通过记1

    注意事项

    本文(心理测量学理论(“测验”有关文档)共163张.pptx)为本站会员(牧羊曲112)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开