来源公众号:思维智汇
视野
在“双减”政策深化与人工智能技术迭代的双重背景下,中小学考试命题正经历从“知识本位”到“素养本位”的深层变革。如何让考试真正成为撬动教育质量提升的杠杆?国际测评体系与本土实践给出了重要启示。
“学会求知、学会做事、学会共处、学会生存。”
——联合国教科文组织
全球范围内,以PISA为代表的国际测评体系正推动教育评价从“知识掌握”向“素养发展”的深刻变革。
01
从两道题看国外学生素养怎么考?
素养怎么评?
先来看两份国外考试卷的例题:
案例1:芬兰高中毕业考试(数学卷)
某社区计划建造一座生态公园,需解决雨水收集系统设计问题。学生需根据地形图(附等高线)、降雨量数据表、材料成本清单等资料,完成以下任务:
计算不同区域雨水收集量;
选择排水管道的最佳铺设路径;
撰写报告说明设计方案的环保效益与经济性。
此题通过真实工程问题,将数学能力与可持续发展目标结合,同时考核数据可视化、成本效益分析等职业技能。其素养体现在于:
跨学科整合:融合数学建模、环境科学、经济学知识,体现真实问题解决能力;
过程性评价:从数据计算到方案论证,考核逻辑推理与批判性思维;
社会参与:将数学能力与可持续发展目标结合,强化公民责任感。
案例2:美国共同核心州立标准(CCSS)英语语言艺术测评
阅读材料为气候变化对北极生态影响的科普文章与非虚构报道,要求:
比较两篇文章的论点与证据支撑方式;
以“青少年如何应对气候变化”为题撰写演讲稿,需引用文本数据并提出个人观点;
设计一份面向社区的环保行动倡议书(需包含视觉图表)。
这一设计凸显“表达即行动”的理念,通过语言输出驱动社会责任意识,与PISA倡导的“全球胜任力”评估高度契合。其素养体现在于:
信息整合与批判性思维:通过多文本对比分析培养高阶阅读能力;
表达与创新:从演讲到倡议书,强调语言应用与创造性输出;
全球视野:议题紧扣人类命运共同体,培养跨文化理解力。
我们可以发现无论是芬兰数学题中的可持续发展目标,还是美国英语题中的气候变化议题,都将个人能力发展与社会责任意识培养紧密结合。这种设计体现了教育评价的生态转向——从关注个体知识积累到重视个体对社会系统的积极影响。
OECD 研究表明,具备社会参与意识的学生,其公民责任感指数是普通学生的 2.3 倍,未来职业成功概率提升 58%。
通过上述两个案例,可以看出当前国际测评体系普遍围绕以下维度构建试题框架:
情境真实性:芬兰高中毕业考试的“生态公园设计”任务,整合地理数据与经济学模型,模拟城市规划决策流程。
能力整合性:美国CCSS英语测评要求学生对比气候变化文章并撰写倡议书,融合批判性阅读、科学论证与公民行动能力。
思维高阶性:允许答案多元化,通过双位编码评分捕捉学生思维过程。

02
国际素养测评发展趋势
当下,国际素养测评呈现出以下趋势:
从知识考核向能力与素养综合评价转变
传统教育评价主要关注学生的知识掌握情况,以考试成绩作为衡量学生学习效果的主要标准。然而,随着社会的发展和教育理念的更新,国际素养测评逐渐从知识考核向能力与素养综合评价转变。
以PISA为例,其测评内容不仅包括科学、阅读和数学等学科知识,更注重考查学生在真实生活情境中运用所学知识解决问题的能力,如科学探究能力、批判性思维、创新能力等。
这种转变反映了教育评价对培养学生综合素质和终身学习能力的重视,旨在培养具有全球竞争力的人才。
跨学科整合
跨学科整合是国际素养测评的重要趋势之一。现代社会发展面临的复杂问题往往需要综合运用多学科知识来解决,因此,国际测评体系越来越注重考查学生的跨学科能力。
例如,上述芬兰高中毕业考试中的数学卷,将数学建模、环境科学、经济学等知识融合在一起,考查学生在真实工程问题中的跨学科整合能力。同样,美国共同核心州立标准(CCSS)英语语言艺术测评,通过气候变化对北极生态影响的科普文章与非虚构报道,考查学生的多文本对比分析能力,培养学生的全球视野和跨文化理解力。
此外,STEAM教育作为一种跨学科的综合教育模式,强调将科学、技术、工程、艺术和数学五个领域的知识和技能融合在一起,引导学生通过探究、创造、合作和反思的方式,培养多学科思维能力。

过程性评价
过程性评价是国际素养测评的另一重要趋势。与传统的结果性评价不同,过程性评价更关注学生在学习过程中的表现和进步,强调对学习过程的持续观察和记录。例如,PISA通过学生的综合科学素养反映基础教育水平,其测评过程不仅关注学生的知识掌握情况,更注重考查学生在科学探究、问题解决等方面的过程性表现。这种评价方式能够更全面地了解学生的学习情况,为教学提供更有针对性的反馈和指导,促进学生的全面发展。
关注社会与全球议题
国际素养测评越来越关注社会与全球议题,培养具有全球视野和社会担当的公民。例如,PISA 倡导的“全球胜任力”评估,强调学生对全球性问题的理解和解决能力,如气候变化、可持续发展等。通过这些议题,培养学生的跨文化理解力、社会责任感和全球视野,使学生能够更好地适应全球化社会的需求。
评价方式多元化
国际素养测评的评价方式日益多元化,不仅包括传统的纸笔测试,还引入了项目式学习任务、实验操作题、案例分析题、论文撰写题等多种形式,为学生提供展示素养的多元平台。
例如,澳大利亚全国读写与数学能力评估项目(NAPLAN)采用计算机自适应测量技术,实现个性化测评报告,有效评估学生的跨学科综合能力。
此外,泛加拿大评估计划(PCAP)注重学生在阅读过程中的知识建构能力,关注学生对文本的理解、解释以及结合个人经验作出批判性回答等方面的能力。
个性化命题
随着现代信息技术的发展,个性化命题成为国际素养测评的新趋势。利用人工智能、大数据等技术,实现根据学生的学习情况和特点进行个性化命题,满足不同学生的学习需求,提高命题的科学性和有效性。
例如,NAPLAN的阅读和数学测试采用自适应测试流程,不同阶段的试题难度不同,学生可以根据自己的测试水平选择适合自己的试题。
教师命题能力建设
国际素养测评的发展对教师命题能力提出了更高的要求。教师需要具备跨学科知识、创新能力、批判性思维等素养,才能设计出符合素养本位的试题。因此,加强教师命题能力建设成为国际素养测评的重要保障。
例如,组织教师参加素养本位命题培训,学习国际先进测评理念与方法,提升教师对核心素养的理解与转化能力。同时,鼓励教师开展命题研究与实践,通过案例分析、试题命制与修订等环节,积累经验,形成命题智慧。

03
素养导向的四大命题转向
基于国际经验与本土实践,中国考试命题需实现以下核心转向:
从“学科割裂”到“跨学科整合”:构建真实问题情境
借鉴芬兰生态公园设计题,可将数学与工程、地理、经济学融合,设计“社区垃圾分类优化方案”类题目。例如:
- 数学+社会学:根据人口密度、垃圾产量数据,计算最优垃圾站分布;
- 科学+伦理学:评估不同处理技术的环境成本,撰写政策建议书。
此类命题需提供多元信息源(如图表、访谈记录),要求学生自主筛选、整合与创新应用。
从“结果评价”到“过程追踪”:嵌入认知能力图谱
利用人工智能技术,开发动态测评平台。
例如,在语文阅读题中嵌入“批注功能”,记录学生的文本分析路径;在科学实验题中通过传感器采集操作数据,生成“实验设计—假设验证—误差分析”的能力图谱。此类数据可为个性化学习提供精准导航。
从“应试工具”到“社会行动”:强化价值引领功能
参考美国CCSS气候变化议题,可设计“本土化”社会参与类题目:
- 历史+公民教育:分析某工业遗址的保护与开发矛盾,撰写致市长的公开信;
- 生物+经济学:设计濒危物种保护方案,结合成本效益分析制作公益广告。
此类命题通过“表达即行动”的理念,将学科能力转化为社会责任意识。
从“统一标准”到“分层赋能”:关注个体成长轨迹
芬兰通过“少考试、多反馈”的随堂评估模式,将学生评价重点从分数转向学习行为与参与度描述。我们可试点“成长档案袋”制度,记录学生在项目式学习、社会实践中的表现,结合AI工具分析生成个性化发展报告,为综合素质评价提供实证支撑。
04
结语:在真实情境中生长的思维品质
素养命题改革不是简单的题型调整,而是教育价值观的重塑。当知识嵌入真实情境,当技术赋能评价过程,当文化滋养思维品质,我们才能培养出兼具创新力与社会责任感的未来公民。
国际测评趋势揭示了一条清晰路径:教育评价必须超越对“知识容器”的测量,转向对“问题解决者”的培育。在“双减”与人工智能的双重语境下,中国教育需以测评改革为支点,构建“素养导向—技术赋能—社会参与”三位一体的新生态。唯有如此,才能让考试真正成为“撬动教育质量提升的杠杆”,而非“束缚创新思维的枷锁”。
近期评论