每日经济新闻 07-13
深夜突袭!万亿参数MoE模型Kimi K2上线即开源,月之暗面能否重归C位?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

2025 年以来略显沉寂的月之暗面,在深夜突袭。

7 月 11 日晚,月之暗面宣布正式发布 Kimi K2 模型,并同步开源。从介绍来看,Kimi K2 是一款具备更强代码能力、更擅长通用 Agent(智能体)任务的 MoE(Mixture of Experts,混合专家模型)架构基础模型,总参数 1T,激活参数为 32B。

本次开源的 Kimi K2 模型分为 Kimi-K2-Base 和 Kimi-K2-Instruct 两个版本,前者是未经过指令微调的基础预训练模型,适合科研与自定义场景;而后者为通用指令微调版本(非思考模型),在大多数问答与 Agent 任务中有更好的表现。

2025 年以来,"Kimi 们 " 的处境正发生着改变。DeepSeek 以低成本、高性能的开源模型强势入场;MinMax 更是火力全开,今年 6 月在向开源社区投下一枚 " 重磅炸弹 ",发布自主研发的 MiniMax-M1 系列模型后,在紧随其后的四个工作日里 " 一日一更 ",直接 " 五连发 ";而一众大厂对于 AI(人工智能)热情和野心也在今年再上一个台阶,阿里、腾讯持续加码 AI,字节来势汹汹,大模型格局的洗牌还在继续。

抛开一切变化,硬实力才是搏击市场的硬拳头。这次,月之暗面能否靠 Kimi K2 重归大模型 C 位?

Kimi K2 上线即开源

月之暗面在官方介绍中称,在 SWE Bench Verified、Tau2、AceBench 等基准性能测试中,Kimi K2 均取得开源模型中的 SOTA(state-of-the-art)成绩。在其公布的测评结果中,Kimi K2 在 Agentic Coding(自主编程)、Tool Use(工具调用)和 Math&Reasoning(数学推理)三个维度的表现上均超过了同为开源模型的 DeepSeek-V3 和阿里 Qwen3。值得一提的是,Kimi 评测中的所有模型均为非思考模型的 Kimi-K2-Instruct。

目前,Kimi K2 的 API(应用程序编程接口)服务已上线,支持最长 128K 上下文,计费方案为 4 元 / 百万 " 输入 "tokens(大模型处理文本时的最小单位),16 元 / 百万 " 输出 "tokens,兼容 OpenAI 和 Anthropic 两种 API 格式。

为了体现 Kimi K2 在代码、Agent 工具调用、风格化写作三项能力上的提升,月之暗面也给出了具体任务下的展示。在前端开发任务中,Kimi K2 支持粒子系统、可视化和 3D(三维)场景等表现形式。

Kimi K2 生成的山川峡谷 3D 景观   图片来源:月之暗面 Kimi 官方公众号截图

而在 Agent 工具调用能力方面,月之暗面表示 Kimi K2 现已具备稳定的复杂指令解析能力,可将需求自动拆解为一系列格式规范、可直接执行的 ToolCall(工具调用)结构。在其释出的案例中,Kimi K2 规划了参加 Coldplay 乐队巡演的行程,可以完成演唱会所在城市的机酒与旅游规划,并且生成日历,再用 html 概括完整行程规划。

《每日经济新闻》记者也使用 Kimi K2 进行了旅游规划的测试。根据 " 两个人计划 8 月份从北京出发,去日本东京以及大阪进行为期 5 天的旅游,希望能看到花火大会、吃到当地特色食物,帮我做一下包括机酒和行程在内的图文并茂的旅行规划 " 的需求,Kimi K2 花费 3 分钟左右进行了一份详尽的旅游规划,规划中包括了具体的餐厅、食物、景点以及一些实用攻略。美中不足的是,这份规划是以文字以及表格的形式呈现的,虽然在最后附上了一个百度网盘链接表示可以自取图片内容,但实际上该链接是无法打开的。

随后,记者进一步提出将规划以 HTML 格式呈现,Kimi K2 在随后交付的网页中补充了一些票务的信息,并完成了 " 图文并茂 " 的需求。不过,与官方演示的案例相比,网页整体的呈现质量还较为粗糙。

每经记者实测 Kimi K2   图片来源:Kimi K2 截图

值得一提的是,此前记者还使用类似的提示词测试过字节的扣子空间。对比两次测试结果可以发现,扣子空间在网页的设计上完成度更高、更为美观。Kimi K2 虽然在此略逊一筹,但旅游攻略制定上更为详细,给出了包括餐厅、景点在内的详细信息,还有如 " 交通卡当地退卡避免异地手续费 " 等注意事项。

此外,本次 Kimi 还特别展示了 Kimi K2 对文字输出风格的掌控,并且在虚构写作任务中,官方还表示:Kimi K2 生成的文字更关注细节与情感,不再是抽象泛泛而谈。记者也以 2025 年北京高考的作文题目 " 数字闪耀时 " 为例,假设 Kimi K2 为高中生,完成一篇一类的记叙文。从完成结果上来说,整体呈现效果良好,但在最后收尾的部分隐约透露出一些 "AI 味 "。

由 Kimi K2 撰写的北京高考作文   图片来源:Kimi K2 截图

Kimi 也从技术角度透露,为了支撑万亿参数模型训练的稳定性,Kimi K2 没有使用传统的 Adam 优化器,而是使用 Muon 优化器。MuonClip 优化器能够稳健支撑万亿参数模型训练,显著提升 token 利用效率。

Kimi 的下一步要走向哪?

Kimi K2 的突袭中,似乎隐含着要打一场翻身仗的决心。

2024 年 11 月,月之暗面创始人杨植麟在接受《每日经济新闻》记者采访时表示,将提升用户留存视为 Kimi 眼下最核心的任务。而在当时,Kimi 还是国产大模型之中备受瞩目的一个。

商业智能数据服务商 QuestMobile 数据显示,截至 2024 年 12 月份,豆包、Kimi、文小言的月活跃用户规模分别为 7523 万、2101 万和 1224 万。Kimi 位列原生 App 领域的 " 三强 " 之一。

随着今年年初 DeepSeek 的横空出世,整个市场格局被迅速打乱。

今年 5 月,《每日经济新闻》联合 QuestMobile 发布的《2025 年一季度 AI 应用价值榜》显示,Kimi 虽仍在月均活跃用户规模上位于第四,但其 2000 万出头的规模已经和以 1.8 亿排在第一的 DeepSeek 相差甚远。在 " 月均下载用户数环比增长 " 一项上,Kimi 甚至出现了负增长,用户数环比下降 3.8%。

2025 年以来,Kimi 对模型的更新升级速度明显放缓。但从 2024 年年底到今年 5 月份,Kimi 在似乎瞄准了垂类领域,寻找新的用户群,先后和财新传媒、小红书、网易游戏《逆水寒》达成合作。

此前 6 月 20 日,Kimi 发布第一个 Agent —— Kimi-Researcher(深度研究)。

据官方表示:" 模型即 Agent,Kimi-Researcher 是基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代 Agent 模型,也是一个专为深度研究任务而生的 Agent 产品。" 当时 Kimi 还表示将逐步开源 Kimi-Researcher 基础预训练模型,以及强化学习后的模型,如今来看的话应该就是本次发布的 Kimi K2。

知名经济学者、工信部信息通信经济专家委员会委员盘和林在接受《每日经济新闻》记者微信采访时对 Kimi 上半年的努力进行了分析。在他看来,Kimi 的努力方向是对的,但还不够,Kimi 需要将自己的 AI 嵌入到一个生态当中。如今,互联网平台各大生态是封闭的,比如电商的 AI 可以帮助商家设计网站,自媒体的 AI 能够帮助自媒体制作视频,那么,Kimi 的目标用户是谁?这方面,需要 Kimi 自己明确。

此外记者注意到,各家今年在升级大模型的时候往往也会 " 卷 " 到价格。

6 月 17 日,MiniMax 发布 MiniMax-M1 系列模型,并以 token 范围分段定价。在 0~12.8 万 token 范围内,据官方介绍,其定价均低于 DeepSeek-R1。

6 月 11 日,豆包大模型 1.6 正式发布时,火山引擎总裁谭待现场表示,豆包 1.6 首创按 " 输入长度 " 区间定价,深度思考、多模态能力与基础语言模型统一价格。豆包 1.6 的综合成本只有豆包 1.5 深度思考模型或 DeepSeek-R1 的三分之一。

而本次 Kimi K2 的定价和 DeepSeek-R1 基本持平。在盘和林看来,目前价格还不完全是竞争的关键因素," 因为同样价格的话,存在先入为主(的问题)。很多用户用过一个 AI,如果价格相同,为什么要去用另一个 AI?这个转换理由有两个,另一个 AI 更便宜,或者另一个 AI 更符合自己需要。我认为 Kimi 不能走低价,而是要走差异化路线。"

每日经济新闻

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

kimi 突袭 阿里 开源 编程
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论