阿里千问 3 登顶全球最强开源模型
阿里大模型又甩出一张王炸。
4 月 29 日凌晨,阿里新一代通义千问模型 Qwen3(简称千问 3)开源,一发布就直接登顶全球最强开源模型。随即相关话题引发全网关注。
图源:微博
这款让全世界震撼的模型,有何特别之处?据了解,Qwen3 是国内首个 " 混合推理模型 ",它将 " 快思考 " 和 " 慢思考 " 集成进同一个模型,能快速低算力处理简单问题,也能通过多步骤深度推理解决复杂问题,有效降低算力消耗。
目前,Qwen3 系列模型一共开源了 8 款 " 混合推理模型 ",包括两款 MoE(混合专家)模型 Qwen3-235B-A22B 和 Qwen3-30B-A3B,以及六个 Dense(稠密)模型 32B、14B、8B、4B、1.7B 和 0.6B。
图源:阿里云
那么,Qwen3 又强在哪里?首要原因是算力成本大幅降低,直接碾压全球各个顶尖大模型。
比如旗舰模型 Qwen3-235B-A22B 参数量仅为 DeepSeek-R1 的 1/3,总参数量 235B,激活仅需 22B。
据市场多方消息,仅需 4 张 H20 即可部署 Qwen3 满血版,而且 Qwen3 旗舰模型的部署成本是满血版 R1 的 25%~35%,部署成本大降 75%~65%,显存占用仅为性能相近模型的三分之一。
其次,Qwen3 大模型的性能也比同类大模型更强,在多个基准测试中表现出色,甚至超过了 DeepSeek-R1 和 OpenAI o1 等顶级模型。
在 Qwen3 系列模型中,旗舰版本 Qwen3-235B-A22B 是性能最强的。据阿里云披露的 Qwen3 基准测试结果,这款开源模型在代码、数学、通用能力等基准测试中,与一众顶级模型相比极具竞争优势,与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等模型不相上下,甚至有赶超的趋势。
Qwen3 基准测试结果 图源:阿里云
具体来看,比如,在奥数水平的 AIME25 测评中,千问 3 取得了 81.5 分,刷新开源纪录;在考察代码能力的 LiveCodeBench 评测中,千问 3 得分超过 70 分,表现优于 Grok3;在评估模型人类偏好对齐的 ArenaHard 测评中,千问 3 以 95.6 分超越了 OpenAI-o1 及 DeepSeek-R1。
另外,在评估模型 Agent 能力的 BFCL 评测中,Qwen3 取得了 70.8 分的成绩,刷新了该评测的记录,并超越了 Gemini2.5-Pro、OpenAI-o1 等顶尖模型。
值得一提的是,Qwen3 模型还支持全球 119 种语言和方言,意味着 Qwen 3 试图开辟更多的国际市场。
不得不说,Qwen3 模型的各项表现极为亮眼。当然,如果拿阿里自身来比较,Qwen3 模型取得的成绩就理所当然和不足为奇。
因为阿里大模型都很能拿得出手,去年 6 月底,通义千问第二代开源模型 Qwen2-72B 亮相即登顶。
当时全球著名开源平台 Hugging Face(笑脸)的联合创始人兼首席执行官在社交平台透露,通义千问第二代开源模型 Qwen2-72B 拿下全球开源第一,力压 Meta、Mistralai 等海外科技巨头。
图源:微博
紧接着今年 3 月 3 日,阿里的另一款大模型 " 万相 2.1 ( Wan2.1 ) " 也取得了优异成绩。
当时开源社区 Hugging Face 最新榜单显示,阿里大模型 " 万相 2.1 ( Wan2.1 ) " 登顶模型热榜和模型空间榜,成为近期全球开源社区最受欢迎的大模型。
图源:通义万相 Wan 公众号
如今,阿里大模型登顶全球最强开源模型,对阿里来说,又是一次重大的技术突破和战略布局。
阿里巴巴要全面 AI 化
阿里大模型能取得如此突破,与阿里在资源上的大力投入密不可分。
在战略层面,阿里巴巴对 AI 业务的重视提高到了前所未有的高度。在上个月的财报电话会议上,阿里巴巴集团 CEO 吴泳铭明确指出,阿里巴巴将持续聚焦国内外电商业务、AI+ 云计算的科技业务、互联网平台产品这三大业务类型。
而对于大模型,吴泳铭强调,未来三年,阿里将围绕 AI 这个战略核心,在 AI 基础设施、基础模型平台及 AI 原生应用、现有业务的 AI 转型等三方面加大投入。
显而易见,阿里巴巴正加速从传统电商公司向 AI 技术驱动的科技公司转型,这是随着 AI 战略深入推进的必然结果,也是两年前吴泳铭提出的 " 用户为先、AI 驱动 " 战略的延续。
要知道过去两年,阿里深受电商低价竞争和市场格局变化的困扰,亟需借助 AI 的力量来打开新的局面。
去年 4 月正值阿里变革一周年,马云在内部会议上激情澎湃地表示:"AI 时代刚刚到来,一切才刚开始,我们正当其时!"
同年 12 月,在蚂蚁集团 20 周年庆典上,马云再次现身并分享了他对未来 20 年 AI 时代的深刻见解,他强调了 AI 技术将如何重塑各行各业,并鼓励蚂蚁集团抓住这一历史机遇。
今年 4 月,马云发表最新演讲,再次大谈 AI。
显然,马云对 AI 战略的重视程度非同一般,将其视为阿里巴巴未来发展的核心驱动力。
为支撑这一战略,阿里巴巴在资源投入上展现出惊人魄力。
去年,阿里接连出售银泰百货、大润发、高鑫零售等非核心资产,同时阿里还频繁减持快狗打车、B 站、陌陌、网易云音乐等长期亏损的非核心业务。
这些动作背后与其聚焦电商、云计算等核心主业的战略目标息息相关。
除了减轻非核心业务的负担,阿里还加大与云计算有关的 AI 投入。
比如加大 AI 人才招聘力度。在 3 月 25 日的汇丰全球投资峰会上,阿里巴巴主席蔡崇信表示,经历了几轮裁员之后,阿里的员工数量已经触底了。接下来,阿里将重新开启招聘。
紧接着 4 月,阿里国际随即传出,首次启动一项面向全球的头部 AI 科技人才培养计划 "Bravo 102",打破传统的校招体系,面试通过后可反选项目和团队。另据阿里国际招聘官网,2026 届校招中 80% 为 AI 岗位,包括 AI 算法、研发、AI 产品经理等。
图源:阿里国际招聘
今年 2 月,阿里还挖来全球顶尖 AI 科学家、前 Salesforce 副总裁许主洪(Steven Hoi),为 AI 业务助力。
在资金投入方面,阿里也毫不含糊。吴泳铭直接放话,未来三年,阿里将投入超过 3800 亿元用于建设云和 AI 硬件基础设施,总额超过过去十年总和。
这一连串的动作,正在把阿里 AI 业务推向高潮。
互联网大厂掀起新一轮 AI 大战
AI 热潮已经持续了两年,今年年初 DeepSeek 的横空出世再次引爆了整个 AI 圈,新一轮的竞赛已然拉开帷幕。无论国内还是国外,各大模型公司都在加速布局,竞相角逐。
当我们聚焦于阿里、抖音、腾讯、百度等国内互联网大厂,他们都以各自的方式铺开业务。
阿里利用开源大模型打开市场,自 2023 年 8 月开始,阿里云便开始大规模开源其大模型系列,成为我国首家大规模开源的大厂,并屡获佳绩。
同时,阿里 AI 业务有了新变化,从过去的侧重面向 B 端,转而向 C 端用户倾斜。上个月夸克上线全新功能 "AI 超级框 ",以及通义 APP 的持续升级改版,都是针对 C 端用户侧的调整。
AI 大模型技术正在快速成熟,应用场景从 B 端向个人用户扩展,C 端用户对 AI 产品的需求日益多样化,由此,C 端市场已成为阿里争夺的新战场。
抖音方面,则选择采取了 " 广撒网 " 式的战略打法,先构建起庞大的 AI 产品矩阵,并采用 " 赛马机制 ",鼓励内部团队围绕同类产品进行差异化开发。
通过多版本并行测试、数据实时反馈,筛选出最具潜力的产品方向,并快速迭代升级。
自 2023 年起,抖音在国内市场加速 AI 产品的落地节奏。据不完全统计,短短两年间,其在移动端推出近 10 款 AI 应用,形成了覆盖聊天、社交、办公、教育、图像、视频、音乐全场景的产品生态。
目前来看,各大互联网公司都力图构建自身的 AI 护城河,抢占先机,重塑行业竞争格局。
作者 | 木易
登录后才可以发布评论哦
打开小程序可以发布评论哦