文|邓咏仪
编辑|苏建勋
发布开源模型 K2 一周后,Kimi 引起的全球热潮还在继续。
7 月 11 日,月之暗面(Moonshot AI)开源了万亿参数的 MoE 模型 Kimi K2。这是一个参数高达 1T,激活参数 32B 的 MoE 模型,包括两款开源模型版本 Kimi-Base 和 Kimi-instruct。
K2 是个 " 偏科 " 选手,擅长编程、智能体类的任务。在 Kimi 公布的测评结果中,Kimi K2 在自主编程、工具调用和数学推理三个维度的表现上,都超过了同为开源模型的 DeepSeek-V3 和阿里 Qwen3。
Hugging Face 数据显示,开源一周后,K2 下载量累计超过 10 万,还在快速攀升中。在大模型权威竞技场 LMSYS 中,K2-Instruct 已经冲到总榜第四,仅次于 GPT-4o、Claude-3.5、Gemini-1.5-Pro。
马斯克在推特上转发了的 OpenRouter 趋势数据显示,K2 的在一周内攀升至全球趋势榜第二,仅次于 Grok 4。
△图源:Twitter
月之暗面这次没有选择大规模营销,而是在用一种全新的方式开源。
K2 发布后,Kimi 的算法工程师、研究员,在推特、小红书、知乎上积极分享 K2 的工作和技术,回复用户疑问;Kimi 的官方推特也在不间断地刷屏,转发社区里对 K2 的赞美和建议。
热情的互动引来了更多的 " 自来水 "。Hugging Face 联合创始人 Thomas Wolf 就对 Kimi K2 大加赞赏,表示开源模型正在挑战最新的闭源权重模型。
发布热闹得像团建,与这家公司过去半年的沉默形成鲜明对比。
过去两年,Kimi 经历了一场过山车般的起伏:几乎是最后一个推出 ChatBot 助手 Kimi,但是凭借着长文本和出圈的策划一炮而红,成为最先出圈的大模型应用产品。
但 2025 年,几乎所有模型厂商,都被横空出世的 DeepSeek 打得失语。追逐 AGI,证明自己还有技术实力,变成了所有厂商要做的证明题。
曾经拥有梦幻开端的 Kimi,在今年来了个猛转弯:To C 的 Kimi 应用停止投流,专心主攻模型。去年曾经试水的 Ohai、Noisee 等其他 C 端应用,以及 Kimi 在多模态上的尝试也迅速暂停。这也让它遭受的质疑更猛烈——是不是放弃了预训练?停止投流后,To C 应用放弃了吗?
蛰伏半年,Kimi 需要一场翻身仗。K2 的发布,就是回归 AGI 主线的一种宣言。
K2 发布,已经引起了全球开发者社区的震动。7 月 16 日,著名的《Nature》杂志发文,表示 K2 的发布为 " 另一个 DeepSeek 时刻 ",足见其赞美。
为什么 K2 的发布如此重要?简单来说,因为 K2 把 DeepSeek 模式再走了一遍:主打高性能、低成本,而且真开源。最重要的是,端出了真的好东西。
K2 是个性能强悍的模型。它很专注,目标清晰——就是为了智能体(Agentic AI)而生。
一位 Kimi 的算法工程师 Justin Wong 在博客里说:Kimi 希望把人与 AI 的交互方式,从 chat-first 变成 artifact-first,即交付一个具体的交付物(比如一个 3D 模型、一个表格),而非交付一段聊天上下文。
用大白话说,就是要真能干活,不只是纯聊天了。
了解了这点,才能理解 Kimi 在模型训练路线上的诸多选择。
DeepSeek R1 发布时,更多注重思考、推理能力,在发布后相当长一段时间才加入工具调用功能。而 K2 并没有像 DeepSeek R1 那样带上推理模式(如展现思考过程),虽然也着重提升了风格化写作能力,但并没有过多强调。
K2 最看重的还是 Agentic(智能体)能力,把提升 " 自主使用工具、完成任务 " 的能力,放到最高优先级。" 这在整个领域里是一个非常罕见的选择。" 一位从业者评论道。
更具体地说,K2 把优化的重点放在了:根据聊天的上下文,调用外部的工具,要让调用速度更快,完成任务的质量更高——比如浏览器、PPT、Excel、3D 绘画软件等等。用户也可以接入 owl、Cline、RooCode 等 Agent/Coding 框架,来自主编程。
所以,在 K2 的使用案例中,你可以看到,直接输入 Prompt,不用怎么等 K2" 思考 ",K2 就迅速生成 3D 旋转地球模型、生成 PPT、生成昼夜循环的山川峡谷 3D 景观、3D 粒子星系、交易看盘等等。
△ Prompt: Create a 3D HTML mountain scene with cliffs, rivers, and day-night lighting. Supports drag/zoom, animated transitions, realistic gradients, and toggleable contour lines... ( 创建一个 3D HTML 山脉场景,包含悬崖、河流和昼夜光照变化。支持拖动和缩放、动画过渡、真实感渐变色,并可切换等高线显示 ... ) 来源:Kimi
把 13 万行的原始数据丢给 Kimi K2,可以帮你分析远程办公比例对薪资的影响,分析显著差异,自动生成统计图表与回归模型解读等等,用统一色调做出小提琴图(violin plot ) 、箱线图(box plot)、散点图(scatter plot)等专业图表,整理成报告。
△来源:Kimi
K2 的另一个核心贡献在于,把模型的训练和使用成本又拉到了一个地板价,同时还保持着接近 Claude 主流模型的性能,主打一个性价比高。
Kimi K2 API 的定价是:每百万输入 tokens 4 元,每百万输出 tokens 16 元;直接和同样主打编程的 Claude 4 Sonnet(每百万输入 3 美元,每百万输出 15 美元)的 API 价格相比,整体成本可以下降超过 75%。
别小看这 75%,如今 AI 编程已经成为创业赛道的 " 明牌 ",赛道里包括 Cursor 等头部 AI 编程公司估值已经迅速起飞。截至 2025 年 6 月,Cursor 的 ARR(年度经常性收入)已突破 5 亿美元大关,相较于 4 月中旬披露的 3 亿美元,短短两个月内飙升了 60%。
开发者会实实在在用脚投票。K2 一出,Hugging Face 的下载量涨得飞快,K2 很快就登上了 OpenRouter 的趋势榜周第二,开发者频频吐槽为什么 API 还这么慢,用不上。
K2 现在并不完美,输出的结果还是会有不足之处,比如 Token 输出比较啰嗦,代码质量和顶尖的 Claude 相比还是有差距——但架不住它性价比高。很多博主的测试案例中,普通程序员写一天代码也就几块钱,大大降低了 AI 编程的算力使用门槛。
性价比高,也源于 Kimi 一些原创性的创新。
Kimi 从训练阶段引入了新的优化器 Muon,取代了原来主流的 AdamW 优化器,在不同 Llama 架构模型上,Muon 的算力需求只有 AdamW 的 52%。
优化器是大模型里的一个核心组件,决定着在训练时的模型参数如何调整。优化器优化得越好,模型在同样的硬件环境下跑得更快、更稳,换种角度说,也更节省了算力。
这可以说是一场技术冒险。Muon 原本是一个比较前沿的优化器方向,甚至没有发表正式论文,以前只在小型模型上训练成功过。但 Kimi 选择将 Muon 扩大到万亿参数去尝试,并且解决了大规模训练下的很多技术难点,让 Muon 成为这次 K2 发布最受尊重的工作之一。
在公司门口放钢琴、公司名字用传奇摇滚专辑命名,这看起来是很朋克。但在巨大的市场压力下,专注在一个方向,把一个新技术架构直接上到万亿参数去训练,用真金白银去试,还成功了。
这才是真的朋克。
从 K2 发布的细节看,DeepSeek 在全球造成的影响仍在持续。
今年 1 月发布的 DeepSeek R1 是全球 AI 叙事的分水岭。在那之前,国内无论是大厂,还是 AI 初创,大家都在卷 AI 应用,抢夺用户和留存。
Kimi 曾经在 2024 年做过一波激进投流,和字节的豆包对打。但投流、增长是在大厂舒适区里的事情,Kimi 很快就显得力不从心。2024 年 11 月,豆包宣布 MAU 过亿,在国内一时风头无两。
很快,这些成果都被 DeepSeek R1 迅速超越。
DeepSeek 之后,无论是大厂还是初创,大家都形成共识:追求模型能力提升才是最重要的事。国内 To C 应用的战场上,几乎就剩下元宝、夸克和豆包在厮杀。
如今商业化已经是个有点遥远,且不是最重要的问题了。面对在模型和应用上都在 All in 的大厂,留给大模型初创的路几乎只有一条:开源,和攻克最难的问题。
前不久的 36 氪 Waves 大会上,真格基金合伙人戴雨森在谈到 Kimi 与 Minimax 时曾说: " 一年前,大家比投放、比用户,比投放,其实是大厂的机会。现在则回到技术前沿,回到强认知,我相信反而更适合以技术大牛为核心的创业团队。 "
六小龙们都做出了自己的选择。DeepSeek R1 的冲击后,各家呈上的答卷,实则表明了一种路线的分野:Kimi 已经有点像 Anthropic,主打提升编程、智能体的能力;Minimax 和阶跃牢牢抓紧多模态;智谱则是走更本土、To B/To G 的路线;百川选择继续做医疗模型;01 早已宣布不再做超大基础模型迭代,转而专注在大模型落地上。
此前,Kimi 在海外知名度有限,但 K2 的爆火已经带来实在的回报:全球开发者圈子里开始关注起 Kimi,有人开始研究 CEO 杨植麟的过往经历。开发者们喜欢这个充满朋克文化的团队—— Kimi 团队成员在小红书、推特展示公司里以传奇乐队命名的会议室,也会在 Twitter 坦承 " 现在 K2 还不完美,infra 还有很多不足,正在加班加点修复。"
△来源:Twitter
而更早之前,在 Kimi 专注提升模型能力,推出包括深度研究等产品后,其实也反哺到了产品上:Kimi 的 Web 端数据从 6 月开始反弹,访问量环比增长 30%。
某种程度上,开源和朋克有着同样的精神内核,自由、开放、尊重技术,这是现在 AI 圈子里最强势的 " 注意力货币 ",不仅能建立名声、展现信仰,还有招揽人才——这才是 AI 初创现在最着急的事。
K2 发布后,一位 Kimi 研究员曾经在博客里提到:" 2025 年,智能的上限仍然完全由模型决定,作为一家以 AGI 为目标的公司,如果不去追求智能的上限,那我一天也不会多呆下去。"
追求 AGI 看似是一条窄路,对还在这条路上的初创公司而言,还是一条康庄大道。
只要足够专注。
封面来源|视觉中国
登录后才可以发布评论哦
打开小程序可以发布评论哦