大规模教育考试命题的基本理论和常用技术.ppt
《大规模教育考试命题的基本理论和常用技术.ppt》由会员分享,可在线阅读,更多相关《大规模教育考试命题的基本理论和常用技术.ppt(173页珍藏版)》请在三一办公上搜索。
1、大规模教育考试命题的基本理论和常用技术,盐城市新课程中考命题培训材料,一、大规模教育考试命题与学校教育的关系;二、大规模教育考试开发的基本问题;三、考试内容规范和试题规范的设计;四、试题背景材料的选择;五、考试的难度;六、选择题的编撰;七、主观题的编撰;八、国家关于初中学业考试和中考命题改革的有关要求。,第一部分 大规模教育考试命题与学校教育的关系,一、教育考试的考试大纲与课程标准的关系 课程标准是考试机构制定考试大纲的基本依据,是教育考试命题的基本依据,但其不能替代考试大纲的作用。考试大纲是教育考试命题的直接依据,也是考试与考生联系的唯一渠道。,国家课程标准是国家对学生在某一方面或领域应该具
2、有的素质所提出的基本要求,是一个面向全体学生的标准。每门课程的课程标准均包括以下基本内容:(1)本门课程的性质、目标和内容框架;(2)指导性的教学原则和评价建议;(3)不同阶段学生在知识与技能、过程与方法、情感态度与价值观方面应该达到的基本要求。,课程标准体系具有三个方面的基本特征:在课程目标上,要求从知识与技能、过程与方法、情感态度与价值观等多方面设计具体的课程。在课程内容上,注重密切联系学生的生活和社会经验以及社会、科技发展的现实,强调学生经验、学科知识和社会发展三个方面内容的整合。在课程要求上,课程标准不仅仅结合知识点明确具体的结果性目标,每个学科还结合本学科的特点,明确提出了一系列过程
3、性目标、体验性目标,以期学生在获得知识的同时,学会学习,形成正确的价值观。,新的课程标准体系对教育考试命题具有决定性影响。首先,它在理论上确定了教育考试的测量目标,这是任何一个考试研究和开发都必须考虑的首要问题。测量目标的设定决定了教育考试命题必须为学校教育服务,反过来又受到学校教育的影响。其次,它确定了教育考试的内容范围和选择试题背景材料的基本出发点,即试题背景材料应该与学生的生活和社会经验相联系,必须与社会、科技发展的现实相联系。第三,试题的设计应该考虑学校教学方法的改进,应该考虑学生学习方法的改善。,考试大纲在教育考试命题中具有其不可替代的作用。首先,课程标准规定的培养目标不一定都是可测
4、的;即使是可测目标,因为受纸笔考试的形式所限,也不一定都是可测的。大规模教育考试只能测量其可测的培养目标。,教育考试只能测量知识与技能、过程与方法、情感态度与价值观的前两个方面的部分目标,而不是全部目标,比如物理、化学、生物学科的一些实验的过程与方法要求,纸笔考试就不可能测量。至于情感态度与价值观方面的目标几乎完全不能测量。我们不排除能够命制出一些好的考查考生情感态度与价值观的试题,但这种试题测量的结果只能作为判别考生在情感态度与价值观方面的认知能力的依据,不能真实地推断考生本人的情感态度与价值观。,其次,教育考试的质量标准要求教育考试的每一个测量目标,都必须有相应的行为目标或标准,教育考试根
5、据这些行为特征来判断考生培养目标的达成度。从现已出版的课程标准看,并非所有科目的课程标准都规定了明确的培养目标的行为特征目标。可以说,没有这些行为特征目标,人们就有足够的理由怀疑考试结果是否有足够高的效度。因此,教育考试命题研究和开发人员在命题前,必须制定明确的培养目标的行为特征目标。告诉考生将以什么标准来判断考生培养目标的达成度。,第三,教育考试是抽样考试,抽样的内容受考试的时间、地点和形式等限制。因此,教育考试不可能考查课程标准规定的所有内容,教育考试所涉及的内容只可能少于课程标准规定的内容。学校、教师和考生对教育考试的内容是十分敏感的。因此,必须通过考试大纲告诉学校的教师、考生,甚至考生
6、家长考试的内容领域和范围。,第四,教育考试有其自身的质量评价标准。为了达到这些质量标准,命题时必须考虑采用哪些题型,对不同题型的比例做出规定。因此,必须通过考试大纲告诉考生,考试将如何测量考生是否达到课程标准规定的目标。此外,教育考试还必须对考试时间、分值、难度要求等做出规定,课程标准不可能包含这些内容,也需要通过考试大纲向考生传递这些信息。,二、教育考试与学校教材的关系 教育考试的开发、命题的基本依据只能是统一的课程标准,而不是具体的这种或那种教材。,课程标准中规定的基本素质要求是教材、教学和大规模教育考试的灵魂,也是整个基础教育课程的灵魂。教材编制、教学设计必须遵守课程标准确定的目标和内容
7、标准。教材的编制是对课程标准的一次再创造、再组织。不同版本的教材可以有不同的编写体例、切入视角、呈现方式、内容编排及图表选择。,三、教育考试的方法与学校教学活动的关系 学校教学活动的形式和学习训练的方式不需要与考试的测量方法完全相同。考试的直接目的和教学的直接目的不同,考试采取的形式与其达到目的的质量要求有关;教学训练方式也要考虑达到教学目的的主要质量要求。,大规模教育考试通常是纸笔考试,考试以试题为基本的测量单元,试题具有不同的形式,即题型,如多项选择题、匹配题、填空题、简释题、问答题、材料分析题等。考试中采用不同的题型,并且每种题型保持一定的数量比例,尤其是主、客观题的比例,以达到考试的效
8、度和信度的平衡。,学校的教学活动是课程学习的基本“单位”,是课程学习的“细胞”。学校教育各个层次的知识和技能、过程和方法、情感态度和价值观目标,最终都主要通过教学活动的开展来实现。教学活动的形式应该与教学活动的目的相适应,同时应该符合学生发展的心理特点和学习的心理规律。,有效的教学必须以各类知识的获得条件和规律为依据。例如,陈述性知识、程序性知识和策略性知识的获得条件和规律各不相同:陈述性知识一般通过理解记忆获得;程序性知识需要在明确操作步骤的基础下进行变式练习来获得;策略性知识需要结合具体的学习内容,在明确其使用条件和操作步骤的基础上,通过有意识的练习来获得。,学生的学习除了听教师讲解外,还
9、可以通过自主学习、合作学习和探究、研究性学习来展开。三种学习各有其不同的基本程序,也反映了三种不同的价值取向。自主学习强调的是培养学生主动、独立的学习能力,为学生自主发展和适应社会奠定基础。合作学习强调的是协作、分享精神,为学生能够在社会群体中的适应和发展做准备。研究性学习强调培养学生探究未知世界的能力,为学生能够创造出更多的新思想奠定基础。,学校教育的目的和课程标准的培养目标也决定了学校的学习训练方式应该多样化,有针对性。学习训练的方式除了通常的解题外,还应该有观察、实验、思辨、探究、调研、阅读、整理、倾听、交流、协作等。一般说来,学习训练的方式包括:书面训练,如解题、写论文等;操作训练,如
10、实验、制作等;课题训练,如专题研究、项目设计等;论辩训练,如演讲、辩论等。学校教学应该根据不同的教学内容,不同年龄段的学生,选择不同的训练方式,让训练方式为教育和教学的目标和内容服务。,但是,在观察初、高中,尤其是毕业班的教学活动过程中,我们发现,教学活动和学习训练大体上是相同的:教师的满堂讲解,大量的与中考或高考相同题型问题的训练。更有甚者,在数学、物理、化学、政治和历史等科目的教学中,很多教师将训练的题目分成若干种问题类型,将每种类型题目的解题套路作为教学重点,即所谓的“分类型,记结语,套解题模式”。,四、教育考试的内容与学校教育内容的关系 从总体上看,学校教育的内容要比教育考试的内容宽泛
11、得多,即使从单个学科的角度看,其教学内容也比学科考试内容广得多。由于受各种条件的限制,大规模考试不可能像学校教学那样采用灵活、多变的形式。学校决不能因为教育考试的内容比学校教育的内容少,就减少学校的教学内容。这样做,只会导致学校教学内容的狭窄化,学校教育功能的弱化,最终降低了学生的培养标准。,很多学校发现考试只考实验知识,不考实验操作,因此就“黑板上画实验”,“课堂上讲实验”,“课下背实验”,或者完全用实验录像来代替学生亲自实验。这样即使学生在考试中得了高分,但由于未受到实验操作、科学方法、科学精神的训练,他们的实验能力是低的,学校教育中强调的情感、态度和价值观教育就很难融于学科教育和教学之中
12、。,第二部分 大规模教育考试开发的基本问题 大规模教育考试开发必须考虑的基本问题一般包括:考试的目的、考试的测量目标、考试的内容领域、考试的方法或题型、试卷结构、考试测量的局限性。,一、考试的目的 大规模教育考试的目的主要在于两个方面:一是对学生进行选拔,如高考、中考这样的考试;二是确定学生是否达到合格要求,如会考以及目前很多省市正在准备推行的学业水平考试。此外,大规模教育考试还有另一个重要的用途,那就是对某些教育项目的效果进行评估,如对某种课程标准以及配套的教材、教学方法等实施效果的评估等。,根据参考标准的不同,教育考试结果可以用两种不同的方法进行解释。如果以某一考生群体的表现为参照标准对考
13、试分数进行解释,可以称为常模参照解释。相反,如果以某一特定的能力水平和能力领域对考试分数进行解释,可以称为标准参照或者领域参照解释。按照这两种方式进行解释的考试就分别称为常模参照考试和标准参照考试。我国的高考、中考等大规模教育考试一般都是属于常模参照考试,人们通常所说的学业水平考试、熟练水平考试属于标准参照考试。,常模参照的大规模教育考试测量目标必须与学校教育执行的课程标准的培养目标保持一致;其考试分数的误差也需要小于选拔区分的分数最小单位,如果高考、中考考试分数的1分就可能决定考生的归宿的话,那么考试的分数误差就应该小于1分;考试也应该具有比较高的有效性,即效度;也应该对学校的教育教学有良好
14、的影响。,标准参照的大规模教育考试主要是检查学生学习是否达到了课程标准设定的基本要求,是否达到了合格标准。命题中必须充分考虑试卷的内容覆盖面,以及能力水平的差异,特别要注意合格与不合格水平的区分,在合格与不合格的临界线附近的考试分数的误差要尽可能小。,二、考试的测量目标 考试测量目标包含两个层面含义,一是理论层面的目标,称之为测量目标。过去,考试是以知识立意,人们理解的考试的测量目标就是考查考生掌握了学科的哪些知识和基本技能。现在考试是以能力立意,人们理解考试的测量目标是考查考生的能力。通俗地说,考试就是考察考生的知识与技能、方法和能力。,考试命题前,必须明确考试命题要根据考生在考试中的哪些行
15、为来做出推测,这就是测量目标的第二个层面含义,即行为目标或行为标准。显然,行为目标必须是具体的,可以观察的,可以测量的。,教育考试的测量目标一般来源于课程标准,尤其是像高考、中考以及学业水平考这样的考试,测量目标只能来源于课程标准。为了获得考试的测量目标而对相关学科的课程标准进行研究,应该关注的内容包括:(1)分析课程标准的总目标中,哪些内容是在特定的考试环境中可测的,哪些内容是在该环境中不可测的。只有那些在特定的考试环境中可测的内容才能够作为考试的测量目标。,(2)分析课程标准中列出的分阶段目标中,哪些内容可以作为具体的行为目标,这些行为目标能否与确定的测量目标相联系。行为目标必须是具体的、
16、系统的,必须有反映行为类型和水平的动词对行为进行尽可能详细的描述,这样可使考试机构内部和外部人员对行为目标的内涵有确切无疑的了解。,三、考试的内容领域及行为目标 考试的内容领域和行为目标是考生复习备考的依据,是命题教师命题的基础,也是考试效度进行检验的基本内容标准。描述大规模教育考试学科的内容领域是为了明确地定义考试的内容领域的范围、内容领域的结构,即内容领域不同方面知识的比例,以及相关的行为目标。教育考试的内容领域及其行为目标是由相关学科的课程标准确定的.,每个内容领域都有以下特征:第一,内容领域具有范围,或内容领域是由确定的内容组成的。只有位于内容领域范围内的试题才能够用来有效地测量考生在
17、该内容领域方面的表现水平。第二,内容领域具有结构,即内容领域由分为不同类型的内容组成,不同类型的内容有一定的比例。第三,内容领域每一类型的内容都具有测量的行为目标。,例:高考地理内容领域描述 1测量的地理内容领域:高中课程标准确定的知识与技能、方法与能力。2地理内容领域的内容类型:A自然地理和地图 C中国地理(1)宇宙中的地球(1)中国的疆域和行政区划(2)大气(2)中国的民族(3)海洋(3)中国的地形和气候(4)陆地(4)中国的河流和湖泊(5)地图(5)中国的区域差异B人文地理(6)北方、南方、西北地区,(1)人类的生产活动(7)青藏地区与地理环境(8)香港特别行政区、澳门(2)人口与环境
18、特别行政区和台湾省(3)人类的居住地聚落(9)中国的国土整治和开发(4)人类活动的地域联系 D世界地理(5)文化景观(1)世界地理概况(6)旅游活动与环境(2)世界地理分区续发展(7)世界政治经济地理格局(3)世界主要国家的地理特征(8)人类面临的环境问题与可持续发展,3.不同类型内容比例A自然地理和地图 3035 B人文地理 3035 C中国地理 1520 D世界地理 1520,四、考试的题型 确定题型对考试设计有着非常重要的意义。首先,题型与考试的效度和信度有相当强的关系。题型不同,测量的行为目标可能有所不同,产生的效果可能不完全相同。题型不同,测量结果的可靠性也可能不相同,分数的误差也可
19、能不相同,信度也就不相同。,第二,大规模教育考试的题型对学校的教学方式和教学训练方式有明显的影响,它既可能促进也可能阻碍学校的课程和教材改革;既可能促进也可能阻碍教师教学方式的改善以及学生学习方式的改善。第三,从经济的角度看,大规模教育考试题型对评分的成本也有很大的影响。,从我国大规模教育考试实践看常用的题型包括多项选择题、是非题、匹配题、填空题、简答题或简释题、材料分析题、问答题、作文题或小论文题。我国考试机构通常按照评分的方式,将上述题型分为客观题和主观题两类。一般用机器阅卷的题型称为客观题,将需要由人工阅卷的题型称为主观题。,题型选择应该遵循下列原则:(1)题型的选择要考虑试题测量的行为
20、目标、涉及到的内容领域以及需要的条件,即题型应该与测量的行为目标要求一致。这反映了考试的效度为第一考虑的观点。,(2)题型的选择要保证考试结果达到预先设定的信度要求,即必须考虑不同题型试题的比例。这反映了考试结果的高信度是考试高效度前提的认识。(3)题型的选择要有利于学校课堂教学方式和学生学习方式的改善,题型要反映高质量的教学活动和学习活动。,五、试卷的结构 试卷结构包括试卷的长度或题量、题型以及不同题型试题的比例、不同难度试题的比例等。许多人都知道试卷的长度与考试的时间长短有关,但很少有人将试卷的长度与考试结果的误差大小或考试结果的信度联系起来。教育考试的设计者在设计和开发教育考试时,应该从
21、控制考试结果误差,保证考试结果信度的角度来考虑试卷的长度。,在大规模教育考试设计中,必须根据考试信度要求或者误差控制要求设置试卷乃至试卷每一部分的最佳题量,保证考试结果的信度或将误差控制在限制的范围内,满足考试目的的需要。同时,在考虑改变试卷的题型结构时,要考虑由此造成的试卷或试卷某些部分长度的变化,以及由此产生的信度的变化。,不同题型试题以及不同难度试题对考试结果信度的影响是不同的。因此,从控制测量误差的角度看,不同题型试题和不同难度试题的多少,对考试结果的信度和误差会产生明显的影响。考试的设计者和开发者应该确定合适的不同题型试题和不同难度试题的比例。,六、考试测量的局限性 考试测量的局限性
22、主要表现在两个方面,一是对测量目标定义方面的局限性,另一个是命题以及评分方面的局限性。,1对测量目标定义的局限性 考生在教育考试中的表现受到很多因素影响,诸如考试的条件、试题的类型、考试的时间、考试时考生的精神状态和生理状态、考生的个性特征等。当然,在教育考试中,影响考生表现的最重要因素是考生的相关能力,如英语语言能力、数学能力等,因为这些是教育考试的测量目标,设计考试就是为了测量考生的这些能力。,为了有效地测量考试要测量的能力,必须对测量的能力进行定义。定义包括两个层面,一是理论层面,一是操作层面。对能力的行为特征目标的定义都存在至少两个方面的问题:一是行为特征目标的定义都具有一定的主观性,
23、不一定能够完全反映考生的相关能力;二是定义的行为特征目标都可能会受到考试不要测量的其他能力或其他因素的影响。由于定义相关能力的行为特征目标的局限性,在考试设计和命题时,要尽可能排除或降低其他因素对考试要测量的能力的影响。,2命题和评分的局限性 命题和评分方面的局限性主要起因于这样的事实:所有对人的能力的测量都是间接的、不完全的、不精确的、主观的和相对的。,间接性 考试是对考生心理特质能力的间接测量,它与对人的生理特征的测量完全不同。即使测量是以考生在一次甚至几次考试中的表现为基础,但仍然将考试分数解释为稳定的心理特征能力的标志。不完全性 教育考试依靠试题来引导考生表现出期望的行为,并且根据这些
24、行为,推测考生具备某种能力的程度。教育考试只是根据考生的部分行为特征来对考生的能力做出推测。在考试中观察的考生的行为只是考生能力表现的一个样本。,不精确性 理论上分数等级越多,评分量表往往越精确。然而,实际评分过程中,只有评分教师能够清楚地区分不同的分数等级,评分结果才能够有足够高的精度。因此,即使能够定义一个具有十个分数等级的评分量表,如果评分教师只能区分三个比较宽泛的分数等级,那么如果坚持使用十个分数等级的评分量表,只会给评分教师和考试分数的使用者产生非现实的精度的假象。,对客观题来说,试题数越多,样本的代表性就越高。如果试题的难度与考生的能力水平不相适应,考试分数的精度就会降低。考试工作
25、者的任务是通过考试研究和命题研究,尽可能使考生应答少受其他能力和因素的干扰,试题的难度尽可能与考生的能力水平相一致。,主观性 教育考试从考试设计到评分,很多方面都具有主观性。考试设计中考试的开发者根据课程标准确定考试的测量目标以及相应的行为特征目标时,要做出主观决策;命题者在命题时从选择材料,到设问方式等都具有主观性;考生在应试时也是凭借主观的理解进行应答,除了客观题评分外,主观题的评分也具有很强的主观性。对考试中考生的表现的正确性或考生的能力水平的解释可能也是主观的。,相对性 教育考试的另一个局限性就是考生能力表现水平的相对性。教育考试是根据考生在考试中的具体行为表现来推测考生的能力水平的。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大规模 教育 考试 命题 基本理论 常用 技术
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-5827364.html