□本报记者 徐梦娇
5月12日上午,杭州国际博览中心,2026世界数字教育大会“人工智能教育发展与评价”平行会议上,这些问题被反复追问:技术越强大,教育如何发展?评价的尺子该怎么握?人在哪里?
会前走访学校时,一个现象让记者印象深刻:不少学生把AI输出直接当成答案,而非进一步探究的素材。AI似乎沦为“快捷答案”,而非探索工具。这真的是人工智能教育想要的结果吗?
记者就此请教中国教育科学研究院教育统计分析研究所副所长祝新宇。他指出背后的尴尬:“现在基层AI的科学合理应用仍有不足,导致高质量评价数据较为匮乏。”评价离不开高质量的数据,但由于应用深度不够,难以有效沉淀出高质量数据。没有数据,谈何评价?祝新宇认为,评价方法的转型是破局的关键。当前,全球数字教育评价多局限于硬件配备率、使用时长等单一量化指标,难以触及“技术是否真正促进了人的发展”这一根本命题。为此,中国教育科学研究院发布的全球数字教育发展指数(GDEI)创新采用了基于多模态证据的评价范式,不仅引入AI技术辅助分析,更将研究范围拓展至全球82个国家。祝新宇坦言:“起初,国外专家对这一中国测算的指数抱有疑虑,但在深入理解其背后的评价逻辑与方法后,越来越多的国际学者开始主动引用我们的研究成果。”
什么样的评价才算有效?会上,经济合作与发展组织教育与技能司司长安德烈斯·施莱彻给出判断:“AI应成为学习的‘脚手架’而非‘拐杖’。”脚手架和拐杖的区别,就是赋能与替代的区别。尺子量的,应该是学生借助AI之后的真实成长,而不是AI替他们完成了多少。
方向之下,现实中的探索走到了哪一步?
浙江省教育科学研究院院长祝鸿平分享了浙江“全学段覆盖、全场景应用、全链条推进”的思路。从基础教育到高等教育,浙江正在推进AI与教育的全域融合。
杭州电子科技大学提供了具体样本。教务处处长林菲介绍,学校引导学生规范、透明、负责任地使用AI,作业必须写明使用了哪些AI工具、如何判断和修改AI输出。评价重心正从“看结果”转向“看过程、看能力、看创新”。“区分的关键,是看学生到底有没有真懂,能不能解释自己的方案。”校长陈积明给出数据:约40%的课程涉及数字化转型,近72.5%的学生具备较强数字竞争力。学生自主研发的智能体“杭小易”连续3年获全国一等奖,思政语言亲和力叙事大模型智能体系统入选全国教育领域人工智能安全向善优秀案例。
区域层面,杭州市拱墅区教育局局长陈亮带来iPRT素养导向评价模型,直指成长过程难记录、行为表现难深解、教师负担重、数据难协同等难题。拱墅区在体育、科学、劳动等学科推行非纸笔测评,用AI串联过程性数据,生成每个学生的成长画像。如陈亮所言:“让每个学生的成长被看见。”
“技术与人的关系”始终是绕不开的议题。澳大利亚莫纳什大学教授德拉甘·加舍维奇认为,人机协同学习的关键在于元认知能力培养,并提出以适应性支架促进认知有效迁移。中国教育科学研究院院长李永智指出,AI正在重构社会分工,评价体系要从筛选成绩转向促进人的全面发展,“人类独有的内驱力是超越AI的核心优势”。
4个多小时的讨论,从施莱彻的“脚手架”到陈亮的“让成长被看见”,都在尝试重新定义评价的方向。李永智最后说:“教育要做的,不是把学生训练成更快的处理器,而是帮助他们成为更好的提问者、更负责任的行动者。”