量子位 昨天
中国模型打服硅谷:Airbnb联创CEO感叹又快又好又便宜!把ChatGPT合作都拒了
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

当 OpenAI 为 ChatGPT 各种造势时,中国模型也在凭实力圈粉老外。

最近,爱彼迎(Airbnb)联合创始人兼 CEO Brian Chesky 的一番公开表态掀起波澜:

我们很大程度上依赖阿里巴巴的 Qwen 模型。它非常好,速度也很快,而且很便宜。我们也会用 OpenAI 的最新模型,但在实际生产中通常不会大量使用,因为有更快、更经济的模型可供选择。

要知道 Brian Chesky 和奥特曼还是挚友,但当涉及自家应用产品整合时,他却没给老朋友留面子,直言 OpenAI 提供的连接工具还 " 没有完全准备好 "。

爱彼迎的选择,是中国大模型技术实力的一个缩影。

特别是在企业级市场,当技术红利期逐渐过去,成本、效率、稳定性这些实实在在的指标,正在成为选择的关键因素。

而中国大模型在这些方面的优势,正越来越受到全球企业的认可。

Airbnb 并非个例。众所周知,Qwen 是生产环境中最高效的模型之一,电商平台 Shopify 以及众多科技公司也都是它的用户。

关键是,这样好用的模型我们还有很多,Kimi、DeepSeek、GLM ……都在各自凭实力全球圈粉。

Qwen 征服爱彼迎

先来看 Qwen 是如何征服爱彼迎的。

今年五月,爱彼迎在美国上线了一款 AI 客服 Agent,可帮助用户完成诸如修改预订或取消订单等操作。据介绍,效果立竿见影,依赖人工客服的用户量直接下降 15%,平均问题解决时间从原来的近三小时,大幅压缩至仅 6 秒。

而支撑这一系统的,是 13 个不同的 AI 模型组成的 " 模型矩阵 ",涵盖来自 OpenAI、阿里巴巴、谷歌等厂商以及开源社区的模型。

其中,阿里巴巴的 Qwen 表现尤为抢眼,在成本、效率和质量的三重考验下脱颖而出。

"又好又快又便宜" —— Brian Chesky 的评价,简单直接,却戳中了当前 AI 商业化的核心痛点。

耐人寻味的是,Brian Chesky 同时透露,没有将公司的在线旅游应用程序与 OpenAI 的 ChatGPT 进行整合。" 我不认为它已经完全准备好 " 这位与 OpenAI CEO 奥特曼私交甚笃的企业家直言不讳。

他甚至曾就这一新功能提出建议,然而在本月首批上线 ChatGPT 的生态应用中,并未出现爱彼迎的身影。

Brian Chesky 指出,原因在于爱彼迎是一个拥有经过身份验证的会员的社区,OpenAI 必须搭建一个足够强大的平台,才能让爱彼迎应用以 " 近乎独立封装 " 的方式在 ChatGPT 聊天机器人中运行。而目前的 ChatGPT 还达不到这个标准。

有网友一语道破关键:

由于这些模型是开源的,爱彼迎可以自行托管模型,并使用自己的公司数据对其进行训练。这就是所有公司最终都会采用的人工智能使用方式。

而中国模型的优势,正在多个场景中得到验证。

Kimi K2 性能碾压

AI 云厂商 Vercel 创始人 Guillermo Rauch 近期发推称赞 Kimi K2 开源模型:

我们正在为内部智能体测试一系列模型…… Kimi K2 比前沿闭源模型快 5 倍,准确率还高出 50%。

据他公布的基准测试结果对比:

Kimi K2(kimi-0905):仅需 2 分钟,准确率超 60%;

GPT-5:耗时约 10 分钟,准确率不足 40%;

Claude Sonnet-4.5:耗时约 8 分钟,准确率不足 50%。

Kimi K2 模型比 GPT-5、 Claude Sonnet-4.5 闭源模型更优。

作为上线仅一周就在竞技场千人盲评中击败 DeepSeek、媲美 Grok 4/GPT 4.5、登顶全球的最强开源模型,Kimi K2 也曾获黄仁勋多次公开称赞。

他在链博会期间表示:

在模型层次,中国发展速度极快,有 DeepSeek、阿里巴巴的 Qwen、Moonshot 的 Kimi 等优秀的技术。

国外初创公司 GlueAI 创始人 Evan Owen 也表示,他们团队同样频繁使用 Kimi K2。

另外,据官方介绍,Cline、Cursor、flowith、Genspark、Kilo Code、Kortix Suna、RooCode、Trae、Vercel、Visual Studio Code、Windsurf、YouWare 等知名编程和 Agent 应用均已接入 Kimi K2 模型。

海外圈粉王者:DeepSeek

最后要说在海外圈粉最多的中国模型,DeepSeek 当之无愧。

盘点近期消息,先是 DeepSeek R1 成果获得 Nature 封面认证,被评审专家称赞 "R1 是首个经历同行评审的大型语言模型,这是一个非常值得欢迎的先例 "。

接着,DeepSeek-V3.2-Exp 上线,引入了新的注意力机制 DeepSeek Sparse Attention,开源了更高效的 TileLang 版本 GPU 算子,引发业界广泛关注。

随后开源的 DeepSeek-OCR 模型更在硅谷引发热议—— 3B 规模、指数级效能变革、大道至简,甚至被认为把谷歌 Gemini 严防死守的商业机密开源了。

刚 " 尖锐 " 评价过 AI 现状的卡帕西也表示很喜欢," 特别是图像比文字更适合 LLM 输入,妙啊 "。

到现在,DeepSeek 新研究引发的夸赞风暴还在继续,甚至不少人觉得这番成果足以预定 " 年度最佳论文 " 了。

从 Qwen 在生产中的 " 又好又快又便宜 ",到 Kimi 在基准测试中的性能碾压,再到 DeepSeek 创新方面的突破——中国大模型正以 " 开放 " 为旗,在全球 AI 竞赛中开辟出一条独特路径。

正如网友所说:

中国模型成为真正意义上的 "Open" 标准…特别是速度还如此之快,这实在疯狂。

参考链接:

[ 1 ] https://x.com/natolambert/status/1980657338726887662

[ 2 ] https://www.latimes.com/business/story/2025-10-21/chesky-says-openai-tools-not-ready-for-chatgpt-tie-up-with-airbnb-app

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—    —

  年度科技风向标「2025 人工智能年度榜单」评选报名火热进行中!我们正在寻找 AI+ 时代领航者  

❤️‍   企业、产品、人物 3 大维度,共设立了 5 类奖项,欢迎企业报名参与   

一键关注 点亮星标

科技前沿进展每日见

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论