在推动教育数字化深入发展的过程中,如何科学验证人工智能在教学中的实际作用,成为行业关注的重点。近期,松鼠 Ai 智能老师在吉尼斯世界纪录™挑战历史上首次开设的人工智能对比实验的挑战纪录,在 2025 年 12 月 15 日成功挑战 " 最多人参与的 AI 与传统教学差异化实验 " 的吉尼斯世界纪录™称号并成功获得认证。

本次挑战联合艾瑞咨询开展实证研究,覆盖五所学校六年级与七年级共 1662 名学生。数据显示,采用松鼠 Ai 智适应系统的教学组,在平均成绩、优秀率等多个维度上表现优于传统教学组。此次实验不仅是一次规模化的教学效果对比,也体现了松鼠 Ai 基于自研多模态智适应教育大模型的技术能力,为 AI 教育从工具应用到成效验证提供了具有参考意义的实践案例。
01 以吉尼斯标准实现科学验证,为 AI 教育效果提供可信参照
吉尼斯世界纪录成立于 1955 年,作为全球公认的纪录认证机构,其认证以独立与严谨著称。每一项纪录的诞生,都代表着某一领域内可验证的突出成果。松鼠 Ai 本次挑战的 " 最多人参与的 AI 与传统教学差异化实验 ",是吉尼斯针对人工智能与传统教学成效比较设立的专项类别。
根据挑战规则,实验需满足分组明确、教学内容一致、学习时长达标、由学科专业见证人全程监督等要求,确保过程的规范性与数据的真实性。松鼠 Ai 严格遵循上述准则,完成了覆盖千余名学生的教学对比,最终获得吉尼斯认证。这标志着该实验的设计与执行符合国际认可的规范,也为 AI 教育的效果研究建立了具有公信力的参照体系。
02 数据印证教学优势,多模态大模型技术支撑个性化成效
艾瑞咨询的独立研究报告为本次实验提供了详实的数据分析。研究覆盖的 1662 名学生被随机分为松鼠 Ai 智适应系统组与真人教学组,并在实验开始时保持了均衡的学业起点。经过一个学期的学习,期末联考数据显示,AI 教学组在多项关键指标上整体优于传统教学组。

六年级方面,松鼠 Ai 智适应系统组的平均成绩达到 87.58 分,较真人组的 78.80 分高出 8.78 分。在等级表现上,AI 组的优秀率 ( 得分率≥ 85% ) 为 67.61%,大幅领先于真人组的 38.46%;合格率 ( 得分率≥ 60% ) 高达 96.48%,优于真人组的 88.86%;同时,AI 组的不合格率控制在 3.52%,显著低于真人组的 11.14%。
七年级方面,松鼠 Ai 智适应系统组的平均成绩为 92.91 分 ( 满分 120 分 ) ,领先真人组 13.84 分。在等级表现上,AI 组的优秀率达到 49.95%,高出真人组 17.78 个百分点;合格率为 81.22%,领先真人组 20.79 个百分点;而不合格率仅为 18.78%,显著低于真人组的 39.57%。
综合两个年级的数据可以看出,松鼠 Ai 智适应系统不仅在整体平均分上取得优势,更在提升优秀学生比例、保障学业合格率以及有效降低不及格率方面展现出全面而稳定的教育成效,实现了 " 整体提优 " 的目标。

图:松鼠 Ai 智适应系统组在六年级、七年级的平均成绩上均远高于真人组
这一成效的背后,依托于松鼠 Ai 自研的多模态智适应教育大模型提供的核心技术支持。作为国内首个教育垂直领域的多模态智适应教育大模型,其能够融合处理文本、图像、语音等多种信息,实现对学习者知识状态、能力画像与情感状态的深度理解与刻画。在本次实验中,该系统基于对海量学习行为数据的分析,为不同的学生规划了差异化的学习路径,并提供了精准的学习内容推荐与错因分析,辅助学生完成个性化学习。
报告的分层数据进一步揭示,无论是对于基础薄弱、中等还是优势的学生群体,AI 教学组均展现出稳定的提升效果,尤其是在助力基础薄弱学生追赶进度方面作用显著。这验证了多模态智适应教育技术不仅能够实现整体教学效率的提升,更在推动大规模 " 因材施教 "、促进教育公平方面展现出切实潜力。
值得一提的是,松鼠 Ai 此次成功挑战吉尼斯世界纪录称号,并通过实证研究呈现 AI 教学组的整体优势,是松鼠 Ai 在 " 技术研发—场景应用—效果验证 " 闭环中的一次重要实践。实验不仅验证了智适应教育系统在教学提效方面的作用,也展现了其背后人工智能教育技术支撑能力。
从推进 AI 教育落地,到以规范实验呈现客观教学成果,松鼠 Ai 正逐步构建起涵盖技术、产品与实证研究的完整体系。松鼠 Ai 本次实验不仅为人工智能在教育场景中的深入应用提供了可借鉴的范例,也为未来教育在个性化、规模化与高质量发展方面的融合创新,带来了新的启示与可能。


登录后才可以发布评论哦
打开小程序可以发布评论哦