快科技 11 月 18 日消息,日前,国内人工智能公司月之暗面推出的 Kimi 国产大模型正式发布 k0-math。
k0-math 是 Kimi 推出的首款推理能力强化模型,采用全新强化学习和思维链推理技术,通过模拟人脑的思考和反思过程,大幅提升解决数学难题的能力。
据了解,在多项数学基准能力测试中,k0-math 的表现能对标 OpenAI o1 系列可公开使用的两个模型:o1-mini 和 o1-preview。
根据官方公布的结果,在中考、高考、考研以及包含入门竞赛题的 MATH 等 4 个数学基准测试中,k0-math 初代模型成绩超过 o1-mini 和 o1-preview 模型,拿下第一。
在业界最常使用的数学能力基准测试 MATH 中,k0-math 模型得分 93.8,超过 o1-mini 的 90 分和 o1-preview 的 85.5 分。
官方表示,k0-math 这一成绩仅次于暂未开放使用的 o1 完全版 94.8 分。
据介绍,常规模型的设定目标是尽快提供问题的答案,但 k0-math 不同,k0-math 模型在做题过程中会花更长的时间来推理,包括思考和规划思路,并且在必要时自行反思改进解题思路,提升答题的成功率。
不过,月之暗面坦言,k0-math 虽然擅长解答大部分很有难度的数学题,但是当前版本还无法解答 LaTeX 格式难以描述的几何图形类问题。
另外,k0-math 还有一些局限性需要突破,包括对于过于简单的数学问题,例如 1+1 等于几,k0-math 模型可能会过度思考,对于高考难题和 IMO 题目依然有一定概率做错、猜答案。
月之暗面表示,这些局限性既是机遇,也是挑战,预计将在下一阶段的模型迭代中逐步得到改善。
登录后才可以发布评论哦
打开小程序可以发布评论哦