来源公众号:光明社教育家 作者:杨志明
历经1300年之久的科举考试造就了我国独特的考试文化,考试的公平性与科学性等问题始终是中央关心、群众关切、社会关注的热点话题。事实上,无论哪种教育考试,总有人会从考试公平、考试难度、题目设计、课程标准等角度作点评,令人困扰:题目太难不行、题目太易也不行,脱离课程标准命题不行、直接把课程标准用作考试大纲也不行,没有情境不命题、情境过分复杂也会招惹是非等。如何把握好考试命题的方向和深浅?须制定一套科学的、符合中国国情的考试命题规程,以便大众能在同一个话语体系中讨论问题、解决问题。这是落实《教育强国建设规划纲要(2024—2035年)》,体现教育的立德树人等政治属性、满足人民群众需求等人民属性、面向未来发展等战略属性的需要。
要解决以上问题,首先要认清我国当前考试命题所面临的三大困境。
一是难以精准把握基于课程标准的命题深度与广度。取消考试大纲后,课程标准逐渐成为考试命题的主要依据。但在把握命题深度和广度方面,各项考试的命题表现水平参差不齐。以《义务教育数学课程标准(2022年版)》为例,新课标要求学生“会用数学的眼光观察现实世界、会用数学的思维思考现实世界、会用数学的语言表达现实世界”。我国高考和国际学生评估项目(PISA)等诸多著名考试正在尝试情境化命题,加之大多数现实情境都蕴含多种学科知识,因此部分命题人员在设置数学命题情境时,刻意大规模地融合了多种学科知识,结果却引起了较大的负面舆论。这说明基于新课程标准的命题方法还不够成熟。若学生答错一道融合了历史等人文社科知识的数学运算题,教师将难以确定其出错的原因究竟是数学运算不会,还是历史等人文社科知识不足。这种考试结果必然会给因材施教带来困惑,令教师无法确定下一步的教学重点是该调整数学运算的教学深度和进度,还是该拓宽学生历史等人文社科知识的知识面,并且后者并不属于数学课程的主要任务。这样的命题思路当然会引起各方人士的议论。
其实,课程标准的侧重点在于指导教学和开展形成性评价,在指导终结性评价时则需要小心谨慎。例如,“小明篮子里有3个苹果,吃掉1个苹果后还剩几个苹果”这样的问题,就特别适合低年级小学生的数学教学。因为其所设计的问题情境不仅体现了新课程标准的要求,而且能帮助小学生从具体形象思维顺利提升到抽象符号思维的层次。但在学习结束后的考试中,理想的题目应该是“3-1=?”,不必重新回到“用数学眼光观察现实世界”的具体形象思维层次,因为考试的关注点是学生的数学思维和数学语言发展状态。
假若一份数学试卷中的绝大多数题目都必须从晦涩难懂的文字阅读开始,还要求学生上知天文、下晓地理,那么数学本身的本质特征必将被弱化,学生在数学抽象、直观想象、逻辑推理、数学运算、数学建模和数据分析等方面的发展必定会受到损害。简而言之,基于新课程标准的命题不等于所有题目都必须是融合多学科知识的情境化试题,也不必把抽象的符号思维改成复杂的文字表述,专业学科考试就该保留足够多的反映其学科本质特征的题目。

二是课程标准专家与教育测评专家的合作有待加强。每次考试之后,题目难度、考试的公平性和有效性等话题都会被热议。要应对好这些问题,只依靠课程标准专家是不够的,还需要有教育测评专家提供有力的数据分析结果作支撑。当前的难点在于二者的联系不够紧密,课程标准专家不太关注教育测评理论,而教育测评专家也不太关注课程标准,许多教育考试机构往往只有命题专家而很少有教育测评专家。
事实上,教育测评理论在保障考试公平性、可靠性和有效性等方面发挥着重要作用,并能用较高视角看待考试难度等方面的问题。比如,根据教育测评理论,要保障考试的公平性,就需要极力降低与考试目的无关因素的影响力,其中就包括所有与考试目的无关的背景知识和文字表述等。例如,一道题目的作答需要某种高档消费体验为基础,则必然会对寒门学子造成歧视性的不公平后果。再如,要提高考试的可靠性或测量信度,就至少需要根据考试目的尽力让试卷中题目的难度分布与全体考生的能力水平分布相匹配。题目太难,学生只好瞎猜,徒增测量误差;题目太易,则许多学生都会接近满分,无法选拔优秀者;若所有题目都是中等难度,则既不能细分优秀群体,也不能细分后进群体。
因此,控制测量误差的有效方法之一就是设计好整套试卷的题目难度分布;要保障考试效度,则需要严格遵循现代教育测评理论所要求的命题流程和质量标准。比如,需要明确考试目的(标准参照性考试与常模参照性考试题型使用可以不同、结果评价或过程评价的试卷结构可以不同等)、界定考试范围、设定表现标准、规范写题要求、预估题目特性、减少评分差错、科学表达结果、获取效度证据、降低负面影响、服务考试目的等。其中,考试范围的界定和表现标准的设定,必须以课程标准为依据。例如,某次面向小学高年级的数学试卷共计36道题,所覆盖的数学核心素养只有数学抽象、逻辑推理、直观想象和数学运算,题量分别是18、11、5和2,占比分别为50.00%、30.56%、13.89%和5.56%。按照新课标要求,这份试卷的内容效度完全不合格。值得重视的是,目前总有命题者喜欢把一些与考试目的无关的知识设置为答题的前提条件。例如,有一道高中语文试题是这样的:“已知f(x)=5cosx/(x^2+1),x∈(-∞,0),则它的图像单调性在《琵琶行》中琵琶女的感情色调中体现为____,____,_____,_____。”类似地,也有命题者设计过这样一道数学试题:“请在1分钟之内写出一个二元二次方程组,用来表达唐代诗人王维在《山中送别》中‘春草明年绿,王孙归不归’所表达的意境。”显然,这种把答对数学题目作为作答语文试题的前提条件,以及用古诗词设置数学命题情境的做法都是不妥的。如此设计题目不仅会严重损害测评的内容效度与构念效度,还会损害测评的后续效度,造成不良后果。这种命题思路显然不是新课标所期待的,也偏离了考试命题的改革方向,更背离了教育的人民属性要求。
三是考试服务者与公众的沟通不够顺畅。考试是一项与群众利益密切相关的事情,备受关注。当前的难点在于一些考试服务者担心引发网络舆情等会造成困扰,所以封锁了大量本应公开或必须公开的信息。事实上,在缺乏真实信息的情况下,与考试利益有关联的人士一旦遇到不理解的现象难免会主观臆测,进而引发一些不必要的事端。
其实,考试质量若真有问题,认真接受群众的批评才是应有的态度。考试服务者若能保障考试质量,并及时公布考试的信度、效度和公平度等信息,必定能在很大程度上消除各种误解、减轻社会焦虑。或许,信息的公开还能倒逼命题质量的提升和服务水平的提高。此外,考试服务者在给考生提供原始分数或常模参照分数的同时,若能根据课程标准一并报告标准参照分数,则不仅能弱化考试分数排名所造成的负面影响,而且有助于教师、学生和家长及时准确地了解学生在知识、能力和素养上的发展状态,丰富家校沟通的内容,方便日后的教学改进。
为了应对上述挑战,建议采用以下一些对策。
首先,制定符合中国国情的考试命题规程,并建立考试质量督查机制。考试服务是一个相对独立的行业,它不仅具有比较成熟的理论和方法,而且有从科举到现代考试所积累的许多成败经验。因此,根据现代教育测评理论,吸取国内外实践经验,完全可以构建一套具有中国特色的教育测评体系,并在此基础上制定国家级考试命题规程。这个规程的主要内容大体涵盖保障考试公平、可靠和有效的要求,包括依据课程标准界定考试内容、设定表现标准的基本要求,以及各种题型的设计要求、组卷原则、施测流程、阅卷评分原则、分数表达方式、结果使用建议等方面的操作指南。有了这个规程,再增设一道类似于财务审计的考试质量督查环节,一方面可以保障并不断提高各种考试的命题水平,另一方面可以使教育管理部门、考试服务者、教师、学生和家长等社会各界人士在一个共同的话语体系中讨论问题及其解决办法。这对于减轻社会各界的考试焦虑、方便教育督导工作、提升考试命题水平等,都很有价值。
其次,加大考试命题人员的培训力度,加强课程标准专家与教育测评专家的合作。当前的命题人员主要是一线教师和各级教科院的教研专家。这个团队的突出优点是熟悉一线教学工作,并对课程标准比较了解,但在教育测评方面的表现水平参差不齐。因此,加强命题团队的测量学专题培训很有必要。培训的内容主要包括两个方面。
一要加强现代测评理论的学习。其目的是使命题人员掌握现代教育测评理论的基本原理和方法,杜绝出台诸如“某项考试的难度必须为0.90或其他某个特定数值”一类的违背考试科学且难以做到的规定。二要加强课程标准的研讨学习。课程标准的侧重点是如何完成教学任务,提升学生的知识、能力和素养水平。课程标准对考试命题的指导意义主要体现在如何从知识和素养等角度界定考试范围、设定表现标准,并把这两类标准用在考试蓝图设计、问题情境设计、试卷编组和分数报告设计与解读等方面。至于具体题目是否应该融合多种学科知识等问题,则需要围绕考试目的来确定。通常,用于标准参照的诊断性考试和过程评价,可以设置一些多学科知识融合的题目,因为这种考试实际上是教学辅助的一种手段,肩负着指导教学和提升学生素养等多方面的任务。不过,对于中考和高考等选拔性考试,则不宜在一份试卷中过多使用多学科融合试题,也不必把问题表达得晦涩难懂。这样设计题目只会增加测量误差,损害考试的有效性和公平性,浪费师生的时间和精力。
最后,建设考试信息沟通平台,及时疏导社会情绪压力。鉴于考试的高敏感性特点,很有必要加强考试服务者和使用者以及其他关联者之间的沟通工作。这也是落实《教育强国建设规划纲要(2024—2035年)》,体现教育的政治属性、人民属性和战略属性的具体措施。这项工作的具体操作可以从以下三个方面入手。
一是创建考试信息服务沟通平台。主要是网络服务平台,内容包括考试项目本身的详细介绍,设定考试范围和表现标准的课程标准依据,建立提问与答疑的互动机制,提供相关政策法规的解读等。
二是利用考试信息服务沟通平台大力开展考试科学的普及工作。无论是教师、家长或其他相关人员,在缺乏考试科学常识的情况下很容易产生误解,造成不必要的社会焦虑。通过沟通平台,相关部门可以组织各方面的专家举办系列讲座以普及考试科学知识,也可以通过不定期的线上线下服务活动,及时回答群众普遍关心的问题等。
三是利用考试信息服务沟通平台实时发布相关的考试信息。例如,考试服务者可以通过发表考试白皮书的方式报告每次考试的信度、效度和分数解读与使用建议,提供考试公平性的证据等。其中,信息的公开程度须依据保护个人隐私和知识产权等方面的要求而定,还须遵守考试命题规程和相关的法律法规,这些内容都可以涵盖在考试命题规程之中。
总之,当前的考试命题遇到了难以精准把握基于课程标准的命题深度与广度、情境化试题的设计过分强调多学科融合、教育测评理论不被重视和考试服务者与大众沟通不畅等问题。建议加强命题专家与教育测评专家紧密协作,加速构建中国特色教育测评理论体系,制定并发布国家级考试命题规程,系统地对考试命题人员开展培训,搭建考试信息服务沟通平台,同时加大教育测评理论的科普、推广力度,合力共促考试命题改革稳步推进、精准落地。
— END —
来源 | 《教育家》杂志2025年3月第1期,原标题《当前考试命题中的三大困境与对策》
作者 | 杨志明 湖南师范大学测评研究中心主任、教授、博士生导师
来源网址:当前考试命题中的三大困境与对策
近期评论