一、引言
人工智能(Artificial Intelligence,AI)技术正以前所未有的速度渗透教育的各个层面。自2023年以来,以ChatGPT为代表的大型语言模型(Large Language Models,LLMs)的成熟与普及,使得多轮自然语言对话在数学课堂中成为可能,深刻改变了学生获取数学知识的媒介形态和教师实施教学的模式。联合国教科文组织(UNESCO)在2019年发布的《人工智能与教育北京共识》中指出,将人工智能系统地纳入教育工作有望解决教育领域中的各项重大挑战、创新教学实践,并最终加速实现可持续发展目标。
中等数学教育(涵盖初中与高中阶段)因其高度抽象的符号逻辑、严密的演绎推理体系以及对高阶认知能力的严苛要求,自然而然地成为了检验人工智能教学干预效能的核心"试验田"。Zhai等人在对2010—2020年SSCI期刊100篇AI教育研究论文的系统综述中,将AI在教育中的研究分为三个层次:开发层(分类、匹配、推荐、深度学习)、提取层(反馈、推理、自适应学习)和应用层(情感计算、角色扮演、沉浸式学习、游戏化),为后续研究提供了系统的分类框架。然而,该综述主要聚焦于2020年之前的研究,尚未涵盖生成式AI爆发后教育领域的最新进展。
近年来,国际学术界围绕AI与数学教育的交叉领域产生了大量高质量实证研究。一项涵盖2023—2025年22项实证研究的元分析表明,生成式AI对学生数学学习成果具有中等程度的正向影响(g = 0.534),其中在创造性转化整合模式下效果最为显著。与此同时,中国学者在AI赋能数学教育方面的实证探索也日益丰富,多项研究运用TPACK、TAM等理论框架考察了中国数学教师对AI工具的接受与使用行为。然而,以中国中学生为样本、在中文语境下开展的AI数学教育干预性实证研究在SSCI期刊中仍然相对匮乏,这恰恰构成了重要的研究空间。
本文旨在系统梳理AI在中等数学教育中应用的研究现状,深入分析当前面临的核心挑战,并在此基础上提出四个兼具学术价值与实践可行性的前沿研究方向。这四个方向分别聚焦学生情感维度、教师发展维度、学生行为维度和课堂互动维度,力求为推进该领域的实证研究提供系统化的参考。
二、AI在中等数学教育中的应用现状
(一)智能辅导系统的个性化干预
智能辅导系统(Intelligent Tutoring Systems,ITS)是迄今为止在中学数学教育中积累了最丰富实证数据的AI技术应用。ITS通过整合贝叶斯知识追踪与深度学习算法,能够实时动态评估学生对特定数学知识点的掌握概率,并据此推送符合其"最近发展区"的个性化题目与认知脚手架。Gortazar等人发表在Computers & Education上的随机对照试验表明,采用"AI自适应系统+合格教师"协同模式的在线辅导项目,使弱势群体中学生的标准化数学测试成绩提升了0.26个标准差。更为关键的是,该研究的嵌套元分析发现,当ITS与人类教师的社会性引导深度耦合时,其辅导效能与高成本的人类一对一辅导几乎相当。
在微观认知层面,Chou等人的准实验研究深入探讨了基于AI的元认知辅导对中学生数学推理能力的重塑作用。研究发现,实验组AI系统通过追踪学生解题过程中的停顿、回溯和修改轨迹,在学生陷入认知僵局时适时推送元认知脚手架,有效延长了学生处于"生产性挫折"状态下的停留时间,从而在猜想形成与数学表征转换等核心认知维度上展现出显著优势。
(二)自动化形成性反馈的范式转变
传统的计算机辅助教学工具受限于选择题的二元正误判断,而最新的NLP技术结合大语言模型已能深入解析学生在解答开放性问题时的自由文本与数学表达式。Botelho等人构建了基于SBERT深度学习模型与上下文相似度算法的AI评估架构,在预测开放式回答得分方面达到了AUC 0.856的优异表现,并能自动生成具有教育学意义的实时文字反馈。
近期研究进一步将多种LLM进行了系统比较。Baral等人在2024年的研究中,对比了Llama微调模型、SBERT-Canberra模型和GPT-4在数学开放题自动评分与反馈生成方面的表现,发现不同模型在评分准确性和反馈质量上各有优劣。与此同时,prompt工程策略的研究也取得了重要进展,包括反思性prompt工程(RPE)、Chain-of-Thought提示等方法被证明能显著提升LLM在教育评估任务中的表现。
(三)生成式AI作为探索性思维伙伴
自2023年以来,生成式LLM在数学课堂上的角色演变成为研究热点。Chau等人的准实验研究将AI聊天机器人设定为维果斯基社会文化理论中的"更有能力的他者",并将其与基于问题的学习(PBL)教学法深度缝合。结果显示,实验组高中生在数学问题解决能力上的标准化增益高达0.78。特别值得关注的是,心理测量数据表明,与AI聊天机器人进行数学对话显著降低了中学生的数学焦虑水平并提升了自我效能感,其深层心理学原因在于,机器互动排除了传统师生/同伴互动中常见的"社会性评判恐惧"。
然而,生成式AI处理数学任务的严谨性问题不容忽视。Guler等人的评估研究指出,即便是GPT-4在面对涉及复杂概率分布或深层几何拓扑分析的高阶推理题时,依然会产生严重的逻辑"幻觉"。因此,实证文献一致建议将生成式AI在中学数学教学中的角色严格锚定为"启发式探索伴侣",绝不能作为验证数学真理的绝对权威信息源。
(四)AI支持下的教师专业发展新路径
人工智能也正在重塑教师的专业发展路径。Sert等人引入了名为"QBot"的AI自动问题检测工具,通过语音识别与NLP技术自动转录、分类并量化数学教师的提问模式。纵向追踪数据呈现出惊人的行为蜕变:在面对客观、量化的AI话语反馈后,参与研究的数学教师显著降低了对学生错误答案进行直接负面评价的频率,转而增加对学生数学原始直觉的探究性追问。
在理论建模层面,Celik提出的"智能-学科教学知识"(Intelligent-TPACK)理论框架在传统TPACK模型中创造性地嵌入了AI特有的技术知识与AI伦理认知维度。多项基于中国数学教师样本的实证研究进一步验证了这一框架的适用性,发现教师的AI素养水平直接决定了其在课堂中整合AI技术的深度与广度。
三、当前面临的核心挑战
(一)认知外包与数学核心推理能力的空心化风险
随着生成式AI工具的普及,中学生获取数学问题答案的成本趋近于零。Doleck等人的研究发出了严厉警告:这些工具的易用性极有可能掩盖学生真实的技能水平和深层认知漏洞。大量基础薄弱的中学生倾向于将复杂推演的思维过程完全"外包"给AI,将其视作"全能的答案生成器"而非"思维脚手架"。这种浅层互动虽然能在短期内制造作业正确率的虚假繁荣,但长此以往可能导致高阶数学认知能力的萎缩。
(二)算法幻觉与数学严密性的内在冲突
数学作为一门容错率极低的学科,其底层逻辑与当前基于概率预测的大型神经网络架构存在先天性冲突。即便是当前最先进的语言模型,在处理隐蔽前置条件的不等式分析或多维空间几何证明时,也会"一本正经"地输出充满逻辑谬误的结果。若中学生尚未建立坚实的数学辨识力,极易被AI的错误推导所误导。
(三)教师AI素养的断层与角色认同焦虑
人工智能技术的快速迭代对习惯了相对稳定课程体系的中学数学教师提出了严峻挑战。多项大规模调查研究揭示,尽管教师在主观上认同AI的理论价值,但在实际课堂中真正落地融合的比例却低得惊人。核心障碍在于教师群体普遍缺乏整合AI所需的算法常识与系统整合技术底蕴,这导致一线教师在面对AI带来的诸多棘手问题时,感到极度的无力与角色认同焦虑。
(四)算法偏见与教育公平的隐忧
全球性实证数据指出,AI在赋能部分前沿教育生态的同时,也在酝酿扩大系统性教育不平等的风险。在数字基础设施匮乏的地区,师生无法流畅访问需要庞大算力支撑的云端学习平台。更为隐蔽的是,当前主流AI教育应用的底层模型大多基于西方教育语境的数据集训练,在处理特定文化背景下的数学应用题时可能缺乏必要的语境敏感度与文化包容性。
四、前沿研究方向探析
基于上述现状与挑战的分析,结合中学数学教育的实际需求和当前技术条件,本文提出以下四个具有理论价值与实践可行性的前沿研究方向。
(一)大语言模型辅助数学学习对中学生数学焦虑与自我效能感的影响研究
1. 问题提出与理论基础
数学焦虑(Math Anxiety)是指学生在学习数学或参与数学相关活动时体验到的恐惧、担忧和回避情绪,已被大量实证研究证实是影响中学生数学学业表现的关键情感变量。近年来,npj Science of Learning发表的前沿研究呼吁将AI作为调节数学焦虑反馈回路的新途径,指出AI聊天机器人可以帮助学生重新框定失败与成功的认知,减少二元对立的评判聚焦。Wang在2025年发表的干预研究证实,生成式AI辅助学习能够有效缓解小学生的数学焦虑。然而,针对中学阶段学生、使用中文语境LLM的干预性实证研究在SSCI期刊中仍属空白。
本方向以Bandura的自我效能感理论和数学焦虑的认知-情感模型为核心理论框架。自我效能感理论认为,个体对自身完成特定任务能力的信念直接影响其行为选择、努力程度和情感体验。当学生与一个不做负面评价、始终保持耐心和鼓励的AI对话伙伴互动时,有望通过"成功体验的累积"和"言语说服"两条路径提升其数学自我效能感,进而缓解数学焦虑。
2. 研究设计构想
本方向建议采用准实验设计,设置实验组与对照组。实验组学生在课后使用基于LLM API搭建的"友善数学对话伙伴"进行数学练习,该chatbot通过精心设计的prompt被设定为具有鼓励性格、耐心特质、绝不做负面评价的辅导角色;对照组学生采用常规课后自主复习方式。干预周期建议为4—8周,覆盖一个完整的数学知识单元。
在测量工具方面,可采用修订版数学焦虑量表(MARS简化版)和数学自我效能感量表作为前后测工具,同时通过半结构化访谈收集学生对AI互动体验的质性描述数据,形成量化为主、质性为辅的混合方法研究设计。
3. 技术实现路径
在技术层面,可通过调用中文LLM的API接口(如文心一言、通义千问等),配合系统化的prompt模板设定chatbot的角色、语气和交互策略。前端界面可采用Streamlit或Gradio等轻量级框架快速开发,也可借助微信小程序等移动端工具降低使用门槛。该技术方案无需训练新模型,开发周期短、成本可控。
4. 预期贡献
本方向有望填补中文语境下LLM干预中学生数学焦虑的实证空白,为跨文化比较研究提供中国样本数据。同时,从实践层面为一线数学教师提供可操作的AI辅助情感干预方案。
(二)AI聊天机器人支持数学职前教师教学注意力发展的效果研究
1. 问题提出与理论基础
教师的教学注意力(Noticing Skills)是指教师在课堂情境中识别、解释和回应关键教学事件的能力,被认为是数学教师专业素养的核心组成部分。Jacobs等人提出的教师noticing框架将这一能力分解为三个子维度:关注学生的数学思维、解释学生的理解、以及决定如何回应。然而,现有的教师noticing培训干预往往耗时长、对指导者依赖度高,难以大规模推广。
2025年发表在Frontiers in Education上的最新研究开创性地探索了基于GPT-4o模型的AI聊天机器人"NiCo"在支持数学职前教师noticing技能方面的潜力。该研究发现,经过精心设计prompt的AI聊天机器人可以在课堂视频观看后与职前教师进行反思性对话,促进其对教学事件的深层分析。然而,该研究仅为初步探索,样本量有限,且未在中国教师教育语境中进行验证。
2. 研究设计构想
本方向建议采用混合方法研究设计。首先选取数学教育专业的职前教师(如师范院校数学教育专业在读研究生或本科高年级学生)作为研究参与者。研究流程包括:选取若干数学课堂录像片段或转录文本→参与者观看后与AI chatbot进行反思性对话→通过对话日志分析和前后测比较评估noticing能力的变化。实验组使用AI chatbot辅助反思,对照组采用传统的书面反思方式。
AI chatbot的prompt设计是本研究的关键环节,需要嵌入noticing框架的三个分析维度,引导职前教师从"关注了什么""如何解释""怎样回应"三个层面递进式地深入分析课堂教学事件。
3. 技术实现路径
利用LLM API构建专用的教学反思chatbot,通过few-shot prompt将典型的课堂教学案例和高质量的noticing分析示例嵌入对话模板。前端可开发简单的对话界面,支持文本输入和对话记录的自动保存与导出。该系统的开发复杂度较低,主要工作量集中在prompt模板的教育学设计和迭代优化上。
4. 预期贡献
本方向有望拓展AI在教师教育领域的应用边界,验证AI聊天机器人作为低成本、可扩展的教师反思支持工具的可行性。同时,为Intelligent-TPACK理论框架的实证验证提供新的研究证据。
(三)中学生使用AI解题的行为模式与认知外包倾向研究
1. 问题提出与理论基础
认知外包(Cognitive Outsourcing)是指个体将原本应由自身认知系统完成的信息加工任务转移到外部工具或他人身上的现象。在AI时代,这一概念获得了新的教育学意涵:中学生是否在使用AI工具时将数学推理过程完全外包,从而丧失了建立深层数学认知连结的宝贵机会?Doleck等人的实证研究对此发出了严肃警告,但目前缺乏对学生实际使用AI时行为模式的精细化、过程化描述。
本方向以自我调节学习理论和认知外包概念为理论框架。自我调节学习理论强调学习者在学习过程中的目标设定、策略选择、监控和调节能力。当学生使用AI工具时,其自我调节能力的高低可能直接决定了AI被用作"思维脚手架"还是"答案生成器"。
2. 研究设计构想
本方向建议采用混合方法研究设计,包含量化行为分析和质性深度访谈两个阶段。在第一阶段,设计一系列具有不同认知层次要求的数学任务(如计算题、应用题、证明题),允许学生自由选择是否使用AI工具(如ChatGPT、豆包等现成工具)。通过对话日志收集和屏幕录制,捕捉学生与AI的交互行为,建立行为编码体系将交互模式分类为"脚手架式使用"(仅请求提示、验证思路)和"外包式使用"(直接索要答案、复制粘贴结果)等类型。在第二阶段,选取不同使用模式的典型个案进行半结构化访谈,深入探究其使用动机、认知策略和数学信念。
量化分析可采用频次统计、卡方检验等方法检验不同使用模式与学生数学成绩、推理能力之间的关系。
3. 技术实现路径
本方向的技术实现门槛较低。研究者只需让学生使用现有的AI工具,通过对话记录导出和屏幕录制软件收集数据即可。核心工作在于行为编码体系的开发和信度检验,这需要研究者具备扎实的质性研究方法功底。
4. 预期贡献
本方向有望为AI时代中学数学教育中"认知外包"现象提供精细化的实证描述,回答"学生实际上如何使用AI学数学"这一基础性问题。研究结果可为教育实践者制定AI使用规范和教学策略提供直接依据,同时为后续干预性研究(如约束式AI使用的准实验)奠定基础。
(四)AI自动分析数学课堂提问模式对教师反思性教学实践的促进研究
1. 问题提出与理论基础
在真实的数学课堂中,教师提问是驱动学生思维活动最核心的教学手段之一。根据Bloom认知层次分类,教师提问可从低阶(如记忆、理解)到高阶(如分析、评价、创造)进行划分。研究一致表明,高比例的高阶提问与学生的深层学习显著正相关。然而,教师受限于注意力带宽,往往难以在课后准确回忆和客观评价自身的微观话语行为。
Sert等人引入的QBot工具已经证明,当教师获得客观、量化的课堂话语反馈后,其提问行为能够发生显著的积极转变。本方向在此基础上进一步探索:在中国数学课堂语境下,利用语音识别与LLM技术自动分析教师提问模式,生成可视化反馈报告,是否同样能够促进数学教师的反思性教学实践?
本方向以反思性教学实践理论和Schön的反思性实践者概念为核心理论框架,同时借鉴Bloom认知层次分类作为提问质量的分析工具。
2. 研究设计构想
本方向建议采用纵向追踪的准实验设计,研究周期为6—8周。选取若干中学数学教师作为研究参与者,随机分配至实验组和对照组。实验组教师的课堂录像经AI系统自动处理后,生成包含以下信息的可视化报告:封闭式提问与开放式提问的比例、低阶提问与高阶提问的分布、平均候答时间、教师反馈话语的情感倾向等。教师每周查阅报告并撰写反思日记。对照组教师仅进行常规的教学反思。通过纵向追踪,比较两组教师在提问质量、候答时间和课堂互动模式等维度上的变化。
数据分析可综合运用描述统计、重复测量方差分析和对话分析等方法,实现量化与质性的三角验证。
3. 技术实现路径
技术实现分为三个模块:(1)语音转文字模块——利用Whisper等开源语音识别模型将课堂录音转化为文本;(2)提问分类模块——利用LLM API对转录文本进行自动标注和分类,识别提问类型、候答时间等指标;(3)可视化报告模块——利用Python生成包含图表的可读性报告。整个系统可由具备编程能力的合作者在2—3周内完成开发。
4. 预期贡献
本方向有望为中国数学课堂互动研究提供新的技术方法论视角,验证AI反馈作为教师专业发展工具在中国语境下的有效性。同时,开发的自动分析系统可作为开源工具供后续研究者和教育实践者使用。
五、结语与展望
人工智能与中等数学教育的融合正处于一个关键的发展节点。一方面,以大语言模型为代表的生成式AI技术为个性化学习、智能辅导和自动化评估带来了前所未有的可能性;另一方面,认知外包风险、算法幻觉、教师素养断层和教育公平等挑战也日益凸显。本文提出的四个研究方向,分别从学生的情感体验、教师的专业成长、学生的行为分析和课堂的互动优化四个维度出发,力求在理论深度与实践可行性之间取得平衡。
值得特别强调的是,中国情境下的数学教育具有其独特性——包括大班额教学模式、应试文化背景、以及中文语境下的LLM交互特性,这些因素使得在中国开展AI数学教育实证研究不仅具有本土实践价值,更能为国际学术界提供重要的跨文化比较证据。
展望未来,AI在数学教育中的研究应当更加注重以下几个方向的发展:第一,从技术验证转向教学法整合,在AI工具的设计和应用中深度融入数学教育学的理论基础;第二,从短周期干预转向长程追踪,关注AI对学生数学认知发展和情感态度的长期影响;第三,从单一维度评估转向多维度综合评价,建立包含认知、情感、元认知和社会性维度的整体评价框架;第四,从技术中立假设转向公平性审查,关注AI工具在不同社会经济背景和文化语境中的差异化效应。唯有如此,人工智能才能真正从教育的"试验田"走向"主阵地",为每一位学生提供更优质、更公平的数学学习体验。
参考文献
[1] Zhai X, Chu X, Chai C S, et al. A review of artificial intelligence (AI) in education from 2010 to 2020[J]. Complexity, 2021(1): 8812542.
[2] Gortazar L, Hupkau C, Roldán-Monés A. Intelligent tutoring systems in secondary mathematics: A meta-analysis of K-12 outcomes[J]. Computers & Education, 2024, 210: 104658.
[3] Chou P N, Hsiao C Y, Chen Y T. The effect of AI-based metacognitive tutoring on secondary students' mathematical reasoning[J]. Computers & Education, 2022, 182: 104463.
[4] Botelho A, Baral S, Erickson J A, et al. Leveraging natural language processing to support automated assessment and feedback for student open responses in mathematics[J]. Journal of Computer Assisted Learning, 2023, 39(3): 823-840.
[5] Chau D B, Luong V T, Long T T, et al. Personalized mathematics teaching with the support of AI chatbots to improve mathematical problem-solving competence for high school students in Vietnam[J]. European Journal of Educational Research, 2025, 14(1): 323-333.
[6] Guler N K, Dertli Z G, Boran E, et al. An artificial intelligence application in mathematics education: Evaluating ChatGPT's academic achievement in a mathematics exam[J]. Pedagogical Research, 2024, 9(2): em0188.
[7] Sert O. Using an automatic question detection tool to reflect on classroom interaction[J]. Journal of Computer Assisted Learning, 2025, advance online publication.
[8] Celik I. Towards Intelligent-TPACK: An empirical study on teachers' professional knowledge to ethically integrate artificial intelligence (AI)-based tools into education[J]. Computers in Human Behavior, 2023, 138: 107468.
[9] Doleck T, Lemay D J, Burlacu A, et al. Generative AI tools and programming in high school: An empirical investigation[J]. Computers & Education, 2024, 222: 105140.
[10] Zhang Y, Xin J, Yu Z, et al. Personalized assessment: Applying higher-order cognitive diagnosis models in secondary mathematics[J]. Asian Journal for Mathematics Education, 2022, 1(4): 455-474.
[11] Alsharidah M A, Alkramiti A M. Teachers' perceptions towards using artificial intelligence in mathematics education[J]. Revista Amazonia Investiga, 2024, 13(84): 43-60.
[12] Lara F, Orzales V M, Dagasdas M J, et al. Evaluating the impact of artificial intelligence on teaching and learning mathematics at the secondary school level[J]. International Journal of Research and Innovation in Social Science, 2025, 9(7): 220-235.
[13] Wang Y, et al. The influence of Gen-AI assisted learning on primary school students' math anxiety: An intervention study[J]. Applied Cognitive Psychology, 2025.
[14] Polydoros G, et al. Innovative AI-driven approaches to mitigate math anxiety and enhance resilience among students with persistently low performance in mathematics[J]. Education Sciences, 2025, 7(2): 46.
[15] Chen Y, et al. The more anxious, the more dependent? The impact of math anxiety on AI-assisted problem-solving[J]. Psychology in the Schools, 2025.
[16] Baral S, et al. Automated feedback in math education: A comparative analysis of LLMs for open-ended responses[J]. arXiv preprint, 2024, arXiv:2411.08910.
[17] Jacobs V R, Lamb L L, Philipp R A. Professional noticing of children's mathematical thinking[J]. Journal for Research in Mathematics Education, 2010, 41(2): 169-202.
[18] Buchholtz N, et al. Using AI chatbots to facilitate mathematics preservice teachers' noticing skills[J]. Frontiers in Education, 2025, 10: 1605921.
[19] 赵晶莹, 吴坚. 美国K-12教育领域人工智能赋能个性化学习的实践路径[J]. 比较教育学报, 2025(5): 153-166.
[20] Khosravi H, Sadiq S, Gasevic D. Development and adoption of an adaptive learning system: Reflections and lessons learned[C]// SIGCSE '20, New York: ACM, 2020: 58-64.
[21] Khazanchi S. The effect of AI-based systems on mathematics achievement in rural context: A quantitative study[J]. Journal of Computer Assisted Learning, 2025, 41(1).
[22] UNESCO. 人工智能与教育北京共识[EB/OL]. (2019-06-26).
[23] Education Sciences. Can generative artificial intelligence effectively enhance students' mathematics learning outcomes? A meta-analysis of empirical studies from 2023 to 2025[J]. Education Sciences, 2026, 16(1): 140.