InfoQ 1小时前
不靠低价抢客户,月之暗面Kimi出海,凭什么硬刚海外AI“御三家”?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

作者 | 褚杏娟

月之暗面 Kimi 正在 C 端爆款产品之外,加速布局 B 端模型服务和全球化市场。

月之暗面 Kimi B 端负责人黄震昕表示,Kimi 的定位并不是做最便宜的模型,而是希望做最高性能的模型。在他看来,无论 To C 还是 To B,本质上都是探索智能上限的不同方式。随着 AI 对生产力结构的改变越来越明显,Kimi 正在围绕 Coding、Agent、长链路推理、多模态理解和企业级应用场景,寻找模型能力进入真实业务流程的路径。

差异化优势:做 All in one 模型

面对海外头部模型的强势竞争,Kimi 希望通过差异化能力进入全球企业的核心业务流程。黄震昕向 InfoQ 表示,Kimi 最终的目标是希望探索智能的上限,希望能和海外那三家模型 " 掰一掰手腕 "。

据介绍,Kimi 的一个重要特色是 All in one。它将视觉理解、Coding 和 Agent 能力融合在一个模型中,而不是将视觉能力作为外接模块单独处理。有些模型会使用类似 "XXX-VL" 版本来处理视觉任务,但视觉并没有完全融合进去。

" 我们在预训练阶段就已经把视觉数据和文本数据放在一起训练,带来的好处是我们能做一些全球其他厂商不太能做到的能力,比如 Visual-to-Code,把视觉动效直接用代码实现出来。" 黄震昕说道。

Kimi 近期还与字节跳动的 Trae 上线了 Visual Debug 功能。开发者遇到 Bug 时,可以直接录屏或截图标识问题,模型便能理解视觉信息与代码上下文,并给出修复方案。这背后是因为 Kimi 团队观察到,大量程序员已经习惯直接丢一张图或录屏给模型做 Debug,Kimi 在 " 视觉 + Coding" 的混合场景上有明显优势。

短期内 Kimi 仍会更多专注模型,因为模型本身还有大量事情要做,把模型做好已经很不容易。

这也体现在人才选择上,月之暗面当前依然优先招聘 " 最聪明、最天才的人 ",让他们去做创新。公司会在研发上提供行业内较高的人均算力和卡数支持,技术和 BD 团队中也有大量毕业于哈佛、斯坦福、康奈尔等高校的成员,人才密度较高。公司整体也非常年轻,尤其在算法和模型底层研发领域,年轻研发人员往往能爆发出更强创新力。团队成员保持个性,又围绕共同目标紧密协作。公司希望每个人都具备审美,做出来的产品不仅要有能力,也要 " 漂亮 "。

但黄震昕也承认,企业级 Agent 的渗透并不是 " 只提供模型就行 "。Coding 场景相对容易在企业内部扩散,但更复杂的 Agent 要进入企业业务流程,需要最后一公里服务。因此,Kimi 会更多选择与亚马逊云科技以及其他合作伙伴合作,由伙伴补齐行业理解、流程改造、系统集成和端到端交付能力。

不过,Kimi 并不打算变成一家重交付公司。黄震昕表示,企业 AI 落地仍需要 " 最后一公里 " 服务,因此 Kimi 也在积极寻找 FDE。就公司自身而言,月之暗面仍会保持对模型的专注,不会做过重的系统集成和交付工作。

进入全球企业核心业务

全球化是 Kimi 的重要方向。

目前,Kimi 已经拥有大量海外用户,场景包括 Coding、Agent 等。黄震昕表示,无论技术推广、开源还是服务,Kimi 都是全球统一推进,"Day 1 就是这么做的 "。

在海外拓展中,亚马逊云科技是 Kimi 的关键合作伙伴。Kimi 与亚马逊云科技的合作是 " 飞轮式 " 的。一方面,Kimi 会采购亚马逊云科技全球云基础设施、算力等服务;另一方面,也希望通过亚马逊云科技的渠道销售 Kimi 服务。

目前,Kimi 已通过两种路径与亚马逊云科技展开合作。

首先,上线亚马逊云科技 Marketplace。该模式下,用户通过 亚马逊云科技 Marketplace 购买 Kimi API 服务,采用的是标准化采购与按量计费机制触达更广泛的用户群体,该路径主要解决的是全球分发与企业采购效率问题。

更深层的合作则指向 Amazon Bedrock。目前,亚马逊云科技 Amazon Bedrock 已经接入了 Kimi K2.5 等开源模型,未来 Kimi 正在积极推进接入更多最新模型,让用户无需自行管理基础设施或单独部署服务器就能使用 Kimi 模型。这意味着双方合作将从 " 渠道接入 " 进一步升级为 " 基础设施级托管 "。同时,Kimi 也在与亚马逊云科技探讨将自身底层推理优化能力(如缓存与推理加速能力)开放,使不同接入渠道下的推理性能体验保持一致。

当前,Kimi 的企业客户已不局限于互联网行业,金融、制造、教育、医疗等行业也都有不少客户与 Kimi 深度合作。

合作模式通常是由 Kimi 提供基础模型能力,亚马逊云科技提供行业经验与客户资源,并联合解决方案架构师共同设计从模型接入、数据接入到业务流程落地的完整路径,用于支持各种场景。另外,针对不同区域与行业的合规与数据要求,亚马逊云科技在安全、隐私与合规体系上的成熟经验也成为合作的重要支撑。

此外,由于大模型推理资源整体仍处于紧张状态,Kimi 在不同渠道存在 TPM(每分钟 token 配额)管理机制。针对亚马逊云科技等重点合作渠道,Kimi 会提供更稳定的算力与配额保障,以支撑企业级使用需求。

不做娱乐化,坚持生产力方向

Kimi 明确强调生产力导向。在所有大模型公司里,月之暗面算是非常有个性,不做娱乐场景,而是专注生产力。

在 C 端,Kimi 已形成一系列生产力产品能力,包括用户熟悉的长文本能力、PPT 能力、深度研究,以及近期发布的 Kimi Work。Kimi 也在发力 Agent 集群等能力,让用户可以同时创建多个智能体协同完成任务。

而在 B 端,Kimi 主要通过 API 方式服务客户,当前重点场景包括 Coding 和 Agent。

Kimi 的 B 端业务不是单一模型接口,而是一个分层服务体系:最底层提供基础模型能力;往上提供多类 API,包括模型 API、搜索 API,以及未来可能开放的 PPT API、深度研究 API 等;再往上提供 Agent SDK,帮助企业更快基于 Kimi 的模型和 Harness 能力构建内部 Agent;最上层则是面向企业的产品层,包括企业版 Kimi,以及 Kimi Agent、Kimi Code、Kimi Work 等能力。

在技术路线上,Kimi 强调的不只是模型效率优化,而是模型底层创新。黄震昕表示,Kimi 非常坚定地相信 Scaling Law 仍将持续向前,也会持续解决 Scaling Law 推进过程中遇到的各种卡点,包括模型架构层面的关键问题。

他进一步解释,行业中不少公司更关注产品层协同设计、上下文长度、推理速度、数据清洗等多维度 scaling。Kimi 并不是不做这些,相反,无论是预训练还是后训练,这些方向内部都在推进,公司也有专门的 Harness team 在各种场景中做尝试。Kimi 不同的点在于,有自己的 " 登月目标 ",不会因为底层架构创新极难就绕开。" 只有在底层架构上实现突破,才能做更大的模型,才能让 Scaling Law 持续向前。"

围绕智能体,Kimi 持续在三个方向进行优化:Token 效率、长上下文能力与多智能体协作。底层的技术创新包括通过 Muon 二阶优化器提升数据利用效率(Muon 已被 GLM、 DeepSeek V4 等模型采用);通过 " 注意力残差 " 提升模型网络架构的效率;通过 Kimi Linear 降低长序列计算成本增长曲线。

今年以来,Harness 对大模型实际应用表现的影响受到关注。不过,随着基础模型能力增强,行业中也出现了 Harness 重要性是否会弱化的讨论。

黄震昕认为,随着基础模型变强,它确实能更好兼容不同环境,从而降低对复杂外部 Harness 的依赖。因此,基座模型厂商不能只盯着现有 Harness,而要向更远的前沿技术看。据悉,Kimi 内部已经开始实践新的 Loop Engineering,即循环工程。相比 Harness,Loop Engineering 会更加简洁,代表了一个新的阶段。

另外,在生产力方面,价格是个不得不面对的问题。今年以来所有模型厂商其实都在涨价,核心原因是全球算力成本上涨,无论海外还是国内,芯片供应都跟不上 token 需求增长,算力成本最终传导到模型侧。

Kimi 希望通过技术优化提升用户性价比、降低实际使用成本。一个关键手段就是 Cache 优化。

黄震昕表示,Kimi 一直在优化 Infra,将 Cache 命中率提升到很高水平。" 只要 Cache 命中,成本就会显著降低。"Cache 命中率 90% 多和 70% 到 80% 相比,实际成本可能相差数倍。当前,在 OpenRouter 上,Kimi 原厂模型供应商的 Cache 命中率超过 90%,位居前列。他提醒道,用户评估模型价格时,不能只看输入输出 token 单价,更要看 Cache 命中率。

面对未来的 token 价格变化,黄震昕认为,只要未来客户获得的是更强模型和更高性价比,即便价格有波动,整体体验仍会提升。

声明:本文为 InfoQ 整理,不代表平台观点,也不构成投资建议,未经许可禁止转载。

会议推荐

大会限时早鸟票享 8 折专属优惠,现在报名立减 1160,更多详情可扫码或联系票务经理 13269078023 进行咨询。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

kimi ai 字节跳动 斯坦福 程序员
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论