聚焦教育场景的大模型，离真正的「教育专用大模型」还差多远？

文章转载来源：AIGC

原文来源：多鲸

作者：曹培杰黄宝忠

图片来源：由无界 AI生成

回望2023年，ChatGPT横空出世，国内外公司纷纷推出自家大模型，加入混战，各种智能化教育产品也随之落地，AI+教育概念热度飙升。由于教育所独有的个性化、互动性需求，教育行业成大模型落地最通畅的场景之一。从通用大模型到教育专用大模型，从AI概念到实际产品，如何推动市场生态走向成熟？

近日，中国教育科学研究院数字教育研究所副所长曹培杰、之江实验室智能教育研究中心主任黄宝忠共同发布了《重构教育图景：教育专用大模型研究报告》（下简称《报告》）。《报告》聚焦教育专用大模型，从技术基础、应用现状、潜在挑战、创新构思、落地场景等方面开展研究。

「大模型」（largemodels）是指具有数十亿到数百亿甚至更多可训练参数的人工智能模型，它是深度学习、GPU硬件、大规模数据集等多种技术共同发展的产物。大模型所展现的强大能力实质上是深度学习中「量变引起质变」的结果。当模型参数量达到一定规模时，模型准确率会经历质的飞跃，这一过程被称之为「涌现能力」，即从原始训练数据中自动学习并发现新的、更高层次的特征和模式的能力。这些能力突出表现为通用的用户意图理解能力、强大的大范围上下文连续对话能力、智能的交互修正能力、内容的润色分类和总结能力、新内容的生成能力、多模态能力。

《报告》指出，教育专用大模型是指以通用大模型为基础的多层次开放技术架构，以多样的教育数字化应用为驱动，通过统一交互对话界面向师生和社会学习者提供专业能力，具备丰富多样的教育专业知识，并在应用中持续升级。作为重点研发领域之一，教育专用大模型是大模型技术、知识库技术以及各类智能教育技术的集成应用，将在教育过程中训练形成教育新场景，实现人类学习和机器学习的双向建构。

教育专用大模型应用包括学习空间互动生成、学习资源按需供给、教师角色转型升级、探究性学习、对话式教学、嵌入式评价、服务式治理等关键要素。

当前，教育专用大模型主要采取两种技术路线：一是直接调用通用大模型，通过微调或提示学习的方式使之具备一定专业能力；二是利用教育领域专业数据，专门训练用于解决教育任务的大模型。

综合当前业内情况看来，这两种技术路线都取得了一定进展，但实现效果仍有待提升。由于缺乏足够的专业数据训练，教育深度知识不够，智能性不强，难以灵活处理复杂多变的教育任务。

《报告》指出，研发教育专用大模型，破解之道在于两条技术路线整合起来。

这并非简单相加，而是通过建立一种全新的开放技术架构，系统整合通用问题解决能力和教育专用问题解决能力，实现技术突破。具体来说，要结合通用大模型与教育领域专业数据，打破数据孤岛，通过开放数据接口源源不断地获得来自常态化教育应用中的数据；要以专家知识库作为大模型的补充，将学科知识和教育教学中的各种规则有意识地「教」给大模型；要整合应用各类智能教育技术，将已经发展起来的各类智能教育技术集成于教育专用大模型之中。

大模型在口语练习、数学学习、情感分析和个性化推荐等方面为教育带来巨大潜力和可能性。《报告》梳理了五种典型的教育专业大模型应用案例，对其发展背景、应用场景、设计特色等进行了深度分析。

教育专用大模型典型应用案例

从应用场景看，星火语伴主要用于语言学习，支持多语言文本、语音和图片的实时翻译，并能纠正语法错误，提供口语陪练等。EmoGPT用于提供心理健康服务，能识别和响应用户情绪，提供持续的心理支持。MathGPT面向全球数学爱好者和科研机构，提供解题和讲题算法，支持用户进行数学解题和练习。智海-三乐用于AI专业教育，提供搜索引擎、计算引擎和本地知识库等功能，支持智能问答和试题生成。Khanmigo通过对话式AI聊天机器人为学习者提供个性化学习方案，同时也支持生涯规划服务、教学方法辅导优化等。

从技术进展看，教育专用大模型在模型性能、应用场景、技术特点方面展现出优势，涵盖了大部分学科内容，主要聚焦于自主学习场景，包括知识问答、语言学习、学习引导和教学辅助等。在技术路线上，「通用+微调」的路径已证明其有效性，许多技术方案以通用大模型为基础，通过指令微调等方式实现针对特定学科知识的有效回答。

从现有不足看，现有教育专用大模型在准确性、教学内容多样性、支持核心教育场景、包容学习者多样性方面还有所局限，存在错误率较高、缺乏共情理解能力等问题，主要侧重于学科知识教学和应试教育情境，在跨学科学习、学生综合能力与高阶思维培养等方面仍有不足；主要聚焦于支持自主学习，在真实课堂、同伴协作、混合教学等场景下如何充分发挥大模型的作用尚未得到有效探索。

总之，大模型在教育领域的应用取得了明显进展，但仍面临着现实问题，需要进一步提升训练数据的质量和规模，尤其是将先进教育理念、教育深度知识和教育核心场景的真实需求深度嵌入技术设计，结合用户反馈进行多轮迭代，形成更智慧、更灵活的教育专用大模型。

《报告》指出，教育自动化和智能化的实现相较于其他领域往往面临着更高的要求。因为教育任务大部分是「非程式化」的，可自动化程度相对较低。随着大模型在模仿、生成、创作等能力上的不断突破，大模型有望在教育过程中得到深入应用。作为一项新兴的人工智能技术，有必要对教育专用大模型可能面临的挑战进行系统性评估。

一方面，智能机器与人类教师之间存在模糊分野。教育任务往往需要人类智慧，这使得具备生成、创造能力的大模型技术在承担复杂认知任务（如艺术创作、决策制定）时，逐渐模糊了机器与教师之间的界限，从而容易导致师生对大模型的过度依赖，造成知识体系的断裂和碎片化、偏见等问题。具体来说，大模型的强大生成能力简化了师生获取信息的流程，但也放大了其对知识探究的惰性。大模型往往会为复杂问题提供简洁、直接的答案，但这些答案缺乏连贯性和完整性，可能导致学生所获取的知识处于不断被切割的状态。

同时，数据集本身或算法等原因导致模型对某些特定群体或主题存在偏好或歧视，可能会导致模型输出的答案或结论存在偏差。

另一方面，通用与专用大模型在人类价值上可能存在冲突。通用大模型在教育领域的应用受限主要源于其缺乏教育领域特定的深度知识和个性化定制能力。这种模型通常是通过广泛而通用的文本数据训练而成，未必能准确理解教育领域特定术语、学科需求及学习模式，由此引发通用与专用大模型之间的过程与结果的冲突、生成与探究的冲突、自动与协作的冲突、透明和可靠的冲突。因此，需要定制基于领域知识深度理解的教育专用大模型来提供更有效、精准和深度的智能化支持。

《报告》秉持「应用驱动、共建共享」的理念，提出了开放创新的教育专用大模型架构，通过集成通用大模型、教育场景模型（小模型）和知识库三条技术路线，让教育专用大模型赋能各级各类教育数字化应用，让智能算力像「水电」一样，接入每一所学校、每一个课堂、每一台终端，让生成式人工智能成为广大师生的亲密助手。

教育专用大模型的开放创新架构分为三层，分别是基础能力层（L0）、专业能力层（L1）、应用服务层（L2）。基础能力层（L0）基于通用大模型的基础能力，根据多元教育数据类型和多元任务需求，调用不同类型的大模型。专业能力层（L1）包括教育场景模型库和专家知识库。应用服务层（L2）将各类教育数字化应用接入大模型，在大模型为应用赋能的同时，将应用数据源源不断传入大模型，持续提高大模型的教育专业能力。

教育专用大模型开放创新架构

教育专用大模型并非单一、封闭的模型，而是一个开发者和用户共同参与持续完善的过程。广大师生和各类教育数字化产品的研发者既是模型的使用者，也是模型的贡献者、建设者，由此形成共建共享的教育专用大模型创新生态。教育专用大模型的技术路线包括大规模多元教育数据采集、数据预处理、特征工程、模型设计、模型预训练、微调与迁移学习、模型评估与调优七个关键步骤。

教育专用大模型的技术路线

教育专用大模型将把「以学习者为中心」理念变成普遍现实。其中，在学前教育阶段，主要表现为尊重儿童、放手儿童，强调培养儿童的自主性、创造性；在基础教育阶段，主要表现为从讲授灌输式教学走向深度理解和研究性学习，强调建立学习者的主体性；在高等教育和职业教育阶段，主要表现为以学生发展为中心，强调科教融合、产教融合；在终身教育阶段，主要表现为以学习需求为导向，重点解决优质教育资源供给与需求匹配的问题。

未来，人工智能大模型将深度融入各领域各环节，赋能千行百业智能升级，助力社会生产力跃升。从通用大模型到教育专用大模型，是人工智能大模型技术深化发展的重要趋势。这不只是在通用大模型基础上进行微调和优化，而是一种基于教育场景、开放模型架构的重大创新。同时，也是推动教育数字化改革、推进教育公平惠普化的重要推力。