8 月 2 日,全球最权威大模型榜单之一的 Chatbot Arena 发布了最新排名。
在总榜上,阿里于 7 月 22 日上线的全新语言大模型—— Qwen3-235B-A22B-Instruct-2507,以 1433 分名列世界第三。
▲来源:通义千问 Qwen
这一分数刷新了全球开源大模型在该榜单的历史最高分,也是中国大模型的历史最高分。
同时,Qwen3-235B-A22B-Instruct-2507 还在数学、代码、复杂提示、长文本检索、指令遵循等 5 项关键能力上夺冠。
此外,由阿里几乎同一时间开源的 AI 编程大模型 Qwen3-Coder-480B-A35B-Instruct,也在编程能力子榜单中与 Gemini2.5 Pro、DeepSeek-R1、Claude4 并列全球第一。
阿里的以上模型有多强悍呢?
以 Qwen3-235B-A22B-Instruct-2507 为例,它能在批量分析电商商品评论的实际应用中,做到精准识别与计算处理,将原本需要 2 小时的人工打标任务压缩到了 5 分钟,且 " 数据质量完全可用 "。
AI 编程大模型 Qwen3-Coder-480B-A35B-Instruct,则被认为 " 善解人意 " 程度超过了 Gemini2.5 Pro、DeepSeek-R1、Claude4,甚至强悍到仅用三句 " 大白话 "(自然语言)指令,就能构建出一个仓储物流管理系统。
而以上模型都采用了宽松的 Apache 2.0 许可证进行开源——允许任何人查看、使用其模型的源代码,并免费商用于各类场景。
▲ Qwen3-235B-A22B-Thinking-2507 开源页面截图
来源:智东西
开源,是阿里在通义千问 Qwen 大模型于 2023 年面世之前,就定下的基本原则。
当时的大模型,还完全是闭源的天下——知名大模型如 Google DeepMind 的 Gemini、Anthropic 的 Claude,包括国内百度的文心一言也都是闭源。
即便是以开源为初衷的 OpenAI 旗下的 GPT,也转投了闭源的怀抱。因为,闭源就可以要求用户成为付费会员,商业化路径清晰可见。
而当时标榜开源的 Llama(由 Meta 出品),公开的部分也仅限于模型本身,并未公开训练代码和训练数据等信息,且要求只可用于科研,不可用于商业,被业界戏称为 " 假开源 "。
但阿里依然坚定地选择了开源,因为开放、开源早已是阿里在技术创新发展上的核心精神和基因。
" 吴妈,我们做了很多事情,做的东西也不错,有技术深度,也有技术挑战。要不开源吧?让外部更了解我们。"
2010 年,时任淘宝网资深技术总监的章文嵩,对时任阿里集团资深副总裁的吴泳铭说道。前者是出了名的开源布道者,他读博士时创建的 LVS ( Linux Virtual Server,Linux 虚拟服务器 ) 开源软件,就已在业界享有盛名。
而吴泳铭的回答则很干脆:" 那你就开始干。"
章文嵩于是从具体项目着手,开启了阿里的开源历程。而后,阿里的开源动作越来越体系化——建立了开源委员会,有了开源流程,且将开源成就作为每年职级评审的加分项之一。
从此,开源作为传统,融入了阿里的血脉。
即使 2015 年有人提出竞争对手使用阿里开源的软件实现了研发提速,即使发起人章文嵩后来从阿里离职,这一传统也未改变。
这也算是马云侠客情怀的具体表现之一,是本该有的互联网精神核心的一部分——我为人人、人人为我。
时间来到大模型时代,互联网越来越成为水电一样的基础设施,却越来越难再听到 " 互联网精神 " 的提法,阿里则再次举起了这面旗帜。
阿里云 CTO 周靖人曾在访谈中提到,阿里的愿景是 " 让天下没有难做的生意 ",阿里云的初心是 " 让企业能在云上高效实现技术和业务创新 ",而开源大模型则是 " 希望企业能更容易地把大模型用到业务里 ",这三个愿景 " 高度一致、一脉相承 "。
现任阿里巴巴集团 CEO 的吴泳铭也在 2024 年世界互联网大会上强调,阿里巴巴将坚持向全球开源开放,把 AI 能力转化为千行百业的生产力。
真正的开放、免费,为 Qwen 的后来居上打下一定基础。但在大模型领域起步较晚的阿里,能在强敌环伺中做到全球领先,另一重要秘诀是从阿里云就沿袭下来的勤快——又勤又快,飞速迭代。
甚至有人说,阿里通义千问大模型的迭代,快到让同样标榜开源的 Llama 应接不暇——比如在 Qwen3 首个模型发布后不到三个月的时间内,Qwen 系列又增加了好几个新模型,刷新了好几回 SOTA。
2023 年 8 月,Qwen 系列首个开源模型 Qwen-7B 悄然发布。2024 年 6 月,Qwen2-72B 在十几项国际权威测评中胜过曾是开源界最强的 Llama 系列。如今,Qwen3 一再刷新所有国产模型及全球开源模型的性能新高。
短短两年,开源的 Qwen 已然走过了万水千山。
Qwen 的开源,免费,当然不只是为了精神,也同样为了商业。
其模式,基本等同于互联网的先 " 引流 " 后 " 变现 " ——通过开源,吸引更多用户使用 Qwen 系列大模型;用户使用过程中,尤其企业用户,往往需要采购配套的云产品,如数据库、存储、网络、安全等——而这些正是身为亚太最大云厂商阿里云的核心业务与长项。
通过开源大模型拉动用户,再通过用户推动阿里云业务。目前,阿里的这一策略已经奏效了。
来自各行业的与日俱增的用户,不但可为阿里云带来业务增长契机,也能通过应用实践反哺大模型的优化,进而吸引更多用户使用。阿里的 " 模型—云—行业应用 " 飞轮因此快速转起来。
这在阿里的财报中也已得到验证—— 2025 财年第四季度,阿里云收入 301.27 亿元,同比增长 18%,为三年来最快增速。其中,AI 相关产品的同比增长连续 7 个季度保持三位数。
伴随业务发展,阿里大模型对云业务的带动效果还会持续加强。
如阿里近期发力的以 Qwen3-Coder 为代表的编程大模型,本身就是 " 油水衙门 " ——代码的生成和优化都会消耗大量计算资源,进而拉动云业务。
这在智能体爆发、对 AI 编程需求剧增的当前更为显著。
比如 Anthropic 旗下的 AI 编程模型 Claude Code,刚于今年 5 月开放使用,目前年化收入已超 2 亿美元,赚得盆满钵满。而 Qwen3-Coder 的性能、使用体验不次于它,性价比还更高。
有业内人士因此指出,Qwen3-Coder 将有力争夺 Claude 4 的全球市场份额。而阿里在编程大模型领域的目标,大概也瞄准了在 Agent 时代来临之际,通过开源抢占商业价值和生态势能的高地。
目前,中国在全球最具影响力的大模型,可以说就是两个:Deepseek 和 Qwen。此次 Chatbot Arena 总榜上,二者双双位居前五。
Deepseek 与 Qwen 的发展路线不同。前者更专注于中英文文本推理,后者更关注多尺寸、多语种、多模态以及 Agent 适配。但它们都有一个共同的特征:
开源。
DeepSeek 创始人梁文峰曾在 24 年的访谈中表示:" 中国的 AI 不能永远做跟随者……如果不改变这一点,中国永远只能追赶别人,而不是引领方向。"
阿里巴巴集团董事会主席蔡崇信在 23 年的云栖大会上提到:" 我们坚信,不开放就没有生态,没有生态就没有未来……我们要始终攀登技术高峰,只有站在更先进、更稳定的技术能力之上,才有更大的开放底气。"
目前来看,开源,也是支持这些目标实现的优选途径。
当下,我国的大模型依然与美国存在一定差距,并且受到美国打压、制裁等威胁。
比如,大模型领域广泛使用的底层技术,如 Transformer 架构、Stable Diffusion 模型等均由欧美率先提出并主导,而中国科技创新往往一露头就被美国各种围追堵截和封杀。
如 2025 年 1 月 15 日,美国商务部工业和安全局将中国大模型 " 六小虎 " 之一的智谱 AI 及其相关公司列入实体清单,限制其获取美国技术。
2025 年以来,美国和部分欧洲国家也以 DeepSeek 的数据安全政策为借口,展开审查,并在域内对其进行了不同程度的使用限制。
开源让模型开放,并任使用者审视、修改,且支持在私有等各种环境中运行,大大降低对模型 " 来自哪个国家 " 的敏感度,无疑有利于帮助中国大模型突破封锁,获得更大的发展空间。
而诸如阿里通义千问,还很早就为模型在中英文之外,注入多种语言数据,训练多语言基础模型,进而使其更加全球化,以全球化超越地缘化。
另外很重要的,开源天然地具有社区性质,本质上是邀约全球开发者一起创新发展,进而也能更好获得用户反馈,让用户帮助大模型更好迭代发展。
总结就是,开源一方面可以开放突破地缘壁垒,另一方面可以开放与全球开发者一起进化,集中智慧和力量办大事。对中国的大模型公司而言,它即便不是一条坦途,也更有可能通向胜利。
更长远看,科技与商业的竞争和发展,从来都不只是单纯的技术比拼,也更是格局和眼光的较量。
真正的引领,也不是独占鳌头,而是能同更多人一起往前走,阿里的大模型就正在这样的路上。
THE END
尊敬的读者朋友们,衷心感谢您订阅《华商韬略》,为了便于您及时收到我们的最新推送,敬请星标华商韬略公众号,感谢支持,期待长久伴您同行。
华商韬略出品
主编:毕亚军 责编:周怡
本文仅代表作者个人观点,部分图片来自网络、图虫创意、东方 IC,未能核实版权归属的,不为商业用途,如有侵犯,敬请作者与我们联系
华商韬略旗下公众号,欢迎关注
投稿、约稿、商务合作及建议
敬请联系:010-65580525
zy@hsmrt.com 周总监
"点赞" 是喜欢," 在看分享 " 是真爱
登录后才可以发布评论哦
打开小程序可以发布评论哦