近日,在 36 氪 WAVES 举办的大会上,一个有趣的环节引发了人们的热议:主办方让 Kimi 与 Minimax 两家的投资人进行了对谈。
随着 DeepSeek 的横空出世,整个中国大模型的牌局已天翻地覆。 行业龙头的格局,从原来的大模型六小龙,逐渐演变成了今天的基模五强。
当六小龙不再是市场的焦点时,安静很久的 Kimi 和 Minimax 在 前不久 不约而同有了新动作: Kimi 开源了编程模型 Kimi -Dev,它的第一个 Agent Kimi -Researcher 深度研究也开启小范围测试。而 Minimax 则开源了首个推理模型 Minimax -M1,并完成连续五天 包含大模型、视频生成、音频生成等多个方向的更加 。
从产品侧来看,Kimi 将重心聚焦到 agent,以深度研究为主要方向,似乎有意向金融、学术等方向发力,这条路线虽然已经有了智谱等竞争者,但远离了以生活服务为主的大厂射程,叠加原本不错的基础模型能力,Kimi 似乎找到了自己的舒适区。
而另一边,Minimax 则似乎想要弥补自身的遗憾,在没有接入 DeepSeek 之后,继续发力全方向的布局。
这似乎也意味着,大模型竞争进入下半场之后,更多的变量正在酝酿之中,而从各项评测来看,Kimi 与 Minimax 的新产品,似乎都有着不错的效果。
在没等来 R2 之后的缓冲期,六小龙中的代表们,正在试图携带着各自的大招,开启下半场。而从报道来看,无论是频繁与 DeepSeek 撞论文的 Kimi,还是曾经和 DeepSeek 赌同一个技术路径的 Minimax,似乎都带着一丝不甘心。
而 在大厂 先后加入 大模型赛道 后 ,六小龙中, Kimi 和 Minimax 正试图 找到自己的生存方式。从某种程度来说,竞争的模式正在发生改变,而 在泡沫消散之后,越来越懂经营的六小龙们,也在期待着下一个周期的开始 。
Kimi 和 Minimax 接连放大招
" 一年前,就是比投放、比用户,现在则回到技术前沿,回到强认知,我相信反而更适合以技术大牛为核心的创业团队。因为比投放,其实是大厂的机会,所以我觉得他们状态还挺好的。 " 在这次对谈上,真格基金合伙人戴雨森在谈到 Kimi 与 Minimax 时如是说。
正如其所言, 近日,相较于在教育、医疗等垂类应用场景中争夺的大厂,Kimi 与 Minimax 似乎更希望在基础技术上展现自身的底色。
6 月 20 日,Kimi 官方发布消息, Kimi -Researcher(深度研究) ,开始小范围灰度测试。 据官方消息透露, 模型即 Agent, Kimi -Researcher 是基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代 Agent 模型,也是一个专为深度研究任务而生的 Agent 产品。
做为内测用户,可以看到的是,Kimi 这次试图去打造的就是 " 高实用性 " 以及 " 靠谱 " 的产品。
按照官方的数据, 每个任务平均进行 23 步推理,自主梳理并解决需求 , 平均规划 74 个关键词,找到 206 个网址,由模型判断并筛选出信息质量最高的前 3.2% 内容,剔除冗余、低质信息 。 报告的平均长度在万字以上 , 平均引用约 26 个高质量、可溯源的信源 。
很明显,Kimi 此次直指需要低幻觉类的垂类赛道。从小红书等社交媒体反馈来看,论文党、甚至如金融、法律等高频需要深度探索的方向,都对 Kimi-researcher 有着不错的评价。
专业评测博主 mactalk 评价道:深度研究不算什么新创新,但 Kimi 生成的内容,在信源和形式上确实不错,Kimi 的深度研究功能,除了给到一份分析报告外,还会生成一个网页。看到网页的那刻,给人的感受是,网页也应该成为一种和文本同等重要的交互方式。
与此同时,Minimax 也用全新的模型在展示自身的肌肉。根据极客公园报道, 作为推理模型, Minimax -M1 在长上下文理解能力上,是目前包括所有闭源和开源模型在内,能力全球前二的模型,且在训练和推理成本上 有 极高的性价比。
M1 仍然延续着 MoE 架构,而在注意力机制上和强化学习算法上的创新让 M1 鲜明 地 区别于其他推理模型。模型总参数达到 4560 亿参数,原生支持 100 万 token 的上下文长度输入,以及目前所有模型中最长的 80ktoken 的输出长度。
在 专业上下文能力的测评 中,M1 的表现远超包括 DeepSeek -R1-0528 和 Qwen3-235B 在内的所有开源模型,甚至超越 OpenAI o3 和 Claude 4 Opus,仅小幅落后 SOTA 的 Gemini 2.5 Pro。
除了基础模型的进展,Minimax 在 agent 以及多模态等多个领域也是亮点频出。" 大家最近刷抖音有没有看到 ‘ 吴彦祖教你学英语 ’ ?其实是 Minimax 在提供背后的技术支持。我第一次听的时候,也难以分辨到底是真人还是 AI,直到后来才知道是 Minimax 的客户,感叹这真的挺厉害的。 " 云启资本合伙人陈煜提到。
实用性超强的 agent,能力出众的大模型,Kimi 和 Minimax 试图开启的是一场全方位的竞速,而从更深层次上来看,两家公司更希望表达的则是,打破大众对于大模型赛道的固有心智。
渴望一场DeepSeek 式的胜利
相较于 DeepSeek 的光芒万丈,不得不说,此刻回头来看,Kimi 与 Minimax 是两家曾充满遗憾的公司。
杨植麟 清华出身, 同时在 卡内基梅隆大学(CMU)语言技术研究所(LTI)读博,导师是苹果 AI 负责人 Ruslan Salakhutdinov 和 Google AI 首席科学家 William W. Cohen,这样的学术背景,在技术可信度上远超普通创业者。
而且他 在 循环智能 等方面的创业经历 ,已经在企业级 AI 落地方面证明过自己。这 更能 让资本相信,这个人不只是懂技术,还会做生意。 高频快速的融资,让其估值迅速爬升。
技术背景,管理经验,同时具有大量子弹,这让杨植麟成为前 DeepSeek 时代的明星。
更重要的是, Kimi 的第一仗还打的漂亮, 把长文本技术提升到了 " 中国 AGI 突破口 " 的高度,精准匹配了资本对 其的期待。
但不可否定的是, DeepSeek 的爆火,一定程度上掩盖了 Kimi 的部分声量。
不过,即便是到当下,仍然可以看出,Kimi 在技术实力上,仍然不逊于 DeepSeek。在基础研究环节, 2 月 18 日, DeepSeek 和月之暗面几乎同时发布了他们各自最新的论文,而主题直接「撞车」—— 都是挑战 Transformer 架构最核心的注意力机制,让它能更高效的处理更长的上下文。而更有趣的是,两家公司的技术派明星创始人的名字 , 出现在各自的论文和技术报告里。
而在近日,两者撞车的事件又频频发生。在法律、医疗等方向招聘上的相似,潜移默化的让外界觉得,似乎 Kimi 仍然是能与 DeepSeek 并驾齐驱的存在。
而另一边 Minimax 的遗憾,则来的更为直接。在媒体的报道中,Minimax 其实更早的启用了与 DeepSeek 相同的技术路线。 2023 年下半年,大部分国内大模型厂商还在继续迭代稠密模型(dense model)之际, Minimax 创始人兼 CEO 闫俊杰就把 80% 以上的研发和算力资源 , 投到了一件不确定的事情上—— MoE(Mixture of Experts 混合专家模型)。
2024 年 1 月, Minimax 上线的 abab6,成为国内首个 MoE 大模型。此后,MoE 架构彻底取代稠密架构,成了大模型领域技术迭代的新方向, 而 年初爆火出圈的 DeepSeek , 应用的正是 MoE。 虽然无法一概而论的将两者在此维度上进行比较,但可以验证的却是两者间肉眼可见的落差。
客观来说,与 DeepSeek 技术实力难分伯仲的 Kimi 与 Minimax,在市场中早已无法得到与之匹配的影响力。
而从这个维度上来看,没有被大厂打败,而是被 DeepSeek 超越,也让两家在下一个周期即 agent 的争夺中,渴望着一场真正意义上的翻身仗。
正如戴雨森所言 " 我们不是因为大模型投资 Kimi ,而是投资团队。现在是技术革命的早期,他们仍然是拥有中国最优秀团队的 AI 创业公司之一,以及拥有最多资源的 AI 创业公司之一。 如果我们相信 AI 是一件非常大的事,你有最好的团队,又有最多资源,仍然能够做出很多有意思的事来。 " 而 AI 的下半场,是否仍会按照当下大厂主导,DeepSeek 重点突破的模式演绎,似乎仍然是一道谜题。
AI 公司的生存逻辑正在重构
进入 6 月,AI 圈似乎达到了比以往更为热闹的情景。罗永浩数字人直播带货拿下天量成交,夸克与元宝在高考报志愿竞逐,同时,豆包上线了 AI 播客功能,美团高层点了第一杯 AI 外卖咖啡,AI 的想象力与应用正在不断加速地渗透至生活的各个角落。
这一切的快速演变,似乎让人看到了红杉 AI 峰会中所提到的, 下一轮 AI,卖的不是工具,而是收益。
但与此同时,对于 agent 未来演变的辩论也在持续。拾象 CEO 李广密曾坦言 Agent 与当前模型能力的匹配程度。 他认为, 今天 Agent 80% 的能力依赖于模型这个引擎。比如,GPT 到了 3.5,多轮对话的通用范式出现了,Chatbot 这种产品形态就行得通了。Cursor 的崛起也是因为模型发展到了 Claude 3.5 的水平,它的代码补全能力才得以成立。
而 AI Research Lead 钟凯祺 则认为:通用 Agent 的需求基本上就是信息检索和轻度代码编写这两类,而 GPT-4o 已经完成得非常好了。因此,通用 Agent 市场基本上是大模型公司的主战场,创业公司很难仅仅通过服务于通用需求来做大。而创业公司基本都聚焦在垂直(Vertical)领域。
回到本文的主角: 当 Kimi 用深度研究 Agent 叩开垂类专业场景的大门,当 Minimax 以推理模型 M1 刷新开源能力边界, 两家公司的每一步动作都在印证同一个事实:大模型竞争早已超越 " 参数比拼 " 的初级阶段,进入到 " 心智占领 " 的核心战场。
DeepSeek 的崛起证明,在大厂与创业公司的博弈中,技术突破与市场定位的精准耦合,足以重塑行业认知 —— 而这正是 Kimi 与 Minimax 此刻最迫切的目标。
从技术路径看, Kimi 押注 " 垂直 Agent",试图用 " 深度研究 " 的专业标签切割出差异化赛道; Minimax 则 试图用 线性注意力机制 打出差异化 ,通过多模态能力构建全场景渗透的想象空间。两者的策略差异,本质是对 "AI 下半场生存法则 " 的不同解读:前者选择在大厂尚未重兵布防的垂类扎根,用 " 高实用性 " 对抗大厂的流量优势;后者则延续 " 全栈布局 " 的野心,试图以技术性价比弥补生态短板。
但这场争夺的关键,或许正如戴雨森所言—— " 投资团队而非模型 "。当 DeepSeek 用技术叙事改写资本逻辑, Kimi 与 Minimax 的核心竞争力,仍在于创始团队对技术趋势的预判能力(如杨植麟对长文本技术的坚持、闫俊杰对 MoE 架构的提前布局)。在大厂凭借资源优势加速内卷的当下,创业公司的破局点从来不是 " 硬碰硬 ",而是像 DeepSeek 那样,在某个技术维度建立不可替代的认知优势,进而占领用户心智。
如今的 AI 下半场,既是技术落地的 " 马拉松 ",也是心智认知的 " 闪电战 "。 Kimi 与 Minimax 的每一次开源、每一个 Agent 的迭代,都是在为 " 下一个 DeepSeek " 的叙事加码。而当行业泡沫逐渐消散,真正能穿越周期的,或许正是那些既能在技术深水区扎根,又能在用户心智中刻下独特标签的团队。这场没有硝烟的战争,才刚刚开始。
参考资料:
字母榜,《闫俊杰不甘心》
字母榜,《minimax 的好日子来了?》
王智远,《 Kimi 还能找到月之亮面吗? 》
凤凰网财经,《 Kimi 和 DeepSeek 又撞车? 》
暗涌,《 一年后,当 Kimi 和 MiniMax 投资人再坐到一起 》
极客公园,《 巨头博弈下,Agent 的机会和价值究竟在哪里? 》
36 氪,《 开源还要 IPO?MiniMax 不想被遗忘在这个夏天 》
月之暗面,《 模型即 Agent,Kimi-Researcher(深度研究)开启内测 》
极客公园,《 MiniMax-M1 登场,MiniMax 再次证明自己是一家模型驱动的 AI 公司 》
登录后才可以发布评论哦
打开小程序可以发布评论哦