时代财经 07-29
阿里巴巴AI“狂奔”:通义千问全球下载量破4亿,一周开源三大模型
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

"2019 年,我们还在讨论单点突破的语言模型;到 2025 年的今天,大模型已呈现‘周级迭代’的爆发态势。" 在 WAIC 2025 上,阿里云副总裁、大数据和智能实验室负责人叶杰平表示,当前 AI 模型技术正经历从 " 渐进式创新 " 到 " 指数级跃迁 " 的转变。

在今年 WAIC 的展区里,阿里巴巴(09988.HK;BABA.NYSE)展示了从 AI 基础设施到大模型再到平台及应用的 " 全栈 AI" 能力,陈列了云原生 CPU 芯片倚天 710、飞天云计算操作系统、智算集群网络架构 HPN7.0 架构、AI Stack 一体机等底层硬核技术,通义千问及通义万相大模型系列,以及阿里云百炼、人工智能平台 PAI 等大模型平台和夸克、钉钉等 AI 应用。

图源:企业供图

这其中,包括最新开源的三款大模型:千问 3 最新版基础模型(非思考版)、千问 3 推理模型、AI 编程模型 Qwen3-Coder。值得注意的是,这三款模型均是在一周内宣布开源。

AI 赛道上,阿里巴巴正在 " 狂奔 "。按照预算,未来三年,这家巨头还将投入 3800 亿元,主要用于建设云和 AI 硬件基础设施,总额超过去十年总和。

一周内开源三款模型

" 三年前,我们发布了通义大模型,并承诺将核心模型开源开放。如今,通义千问已实现全尺寸、全模态的全面开源,真正打破了开源与闭源模型之间的技术壁垒。" 叶杰平称。

开源一直是阿里云发展 AI 的主题词,这一思路在今年由 DeepSeek 掀起的开源浪潮下愈发得到验证。

据了解,千问 3 最新版基础模型(非思考版)性能有显著提升,在 GPQA(知识)、AIME25(数学)、LiveCodeBench(编程)、Arena-Hard(人类偏好对齐)、BFCL(Agent 能力)等测评中表现超越 Claude4(Non-thinking)等闭源模型。

千问 3 推理模型支持 256K 上下文长度,在知识(SuperGPQA)、编程(LiveCodeBench v6)、数学(AIME25)、人类偏好对齐(Arena-Hard v2)、创意写作(WritingBench)、多语言能力(MultilF)等核心能力上,千问 3 推理模型可比肩 Gemini-2.5 pro、o4-mini 等闭源模型。

AI 编程模型 Qwen3-Coder 则是千问系列模型中首个采用混合专家 MoE 架构的代码模型,总参数达 480B,激活 35B 参数,原生支持 256K token 的上下文并可扩展至 1M 长度,能帮助程序员完成基础编程任务,比如写代码、补全代码、修 Bug 等。

海外模型 API 聚合平台 OpenRouter 数据显示,上述三大模型开源后,阿里千问 API 调用量暴涨,三天突破 1000 亿 Tokens,热度超越 GPT、Gemini、Claude 等模型,千问包揽 OpenRouter 趋势榜前三名。截至目前,通义千问在全球主要模型社区的下载量已经突破 4 亿,衍生模型突破 14 万个。

阿里云百炼高级产品专家徐志远在接受时代财经等采访时谈到,千问系列模型在诞生之初就面向全球市场而非局限于国内市场。国内市场方面,依托国内庞大的市场空间以及阿里云自身的公共云基础产品,阿里云更多通过 API 服务或低成本模式为用户提供支持。而在全球市场,若要参与竞争并实现模型能力的对比排序,开源是极为重要且有效的方式——它能让全球开发者成为反馈主体,提供关于模型的直接反馈与信息,帮助阿里云准确判断模型在全球市场的真实水平。

事实上,阿里巴巴在开源上的相关实践获得海外认可也比在国内更早。徐志远谈到,"(在开源过程中)我们收到了全球开发者的反馈,这类反馈在商业场景中往往难以如此直接获取,因为在开源生态中,开发者与我们并无绝对利益绑定,他们的反馈仅基于对模型问题的判断,供我们参考迭代。"

20 万开发者、70 万 Agent

阿里云百炼是全链路大模型服务与 Agent 应用开发平台,据介绍,目前已有超 20 万开发者在百炼上开发了 70 多万个 Agent。

徐志远表示,阿里云百炼目前核心包含三个层面的服务:第一个层面是基础层,即结合阿里云广泛的基础设施以及可调度的 AI 算力,将模型转化为可供调用的高性价比、高性能 API,也即 "model service"(模型服务)层。

第二个层面是 agent(智能代理)层,在模型服务层之上,阿里云百炼整合了部分领先的 agent 框架与架构,为 agent 的开发构建提供一整套支持能力。在该层面,阿里云百炼提供包括兼容金融领域主流的 ATO 协议、MCP 协议,以及支持阿里全栈自研的 agent 模型调度能力等。

第三个层面是 AI 大模型行业及领域应用层。在阿里云百炼上,开发者通过 agent 搭建基础能力后,可进一步构建一系列行业及领域应用。目前,电力、互联网、医疗、金融等行业,均已基于相关能力构建出面向企业内部及企业客户的各类应用。

据徐志远介绍,在阿里云百炼服务的企业中,其中一个核心场景是多元异构复杂数据的处理。他举例解释,在如招聘平台等互联网平台上,每天会产生大量视频、音频、文档等,企业需要通过不同模态模型将内容转化为所需数据,并对这些内容进行结构化提取、入库、向量化或打标,以便用于下游的推荐匹配、分析解析等业务场景。

第二类是企业内部助理相关的应用,面向企业员工、内部子部门等提升生产效率。其他应用场景还包括以图搜图、以视频搜视频、IPC(网络摄像机)等。例如,过去的 IPC 只有摄像头组件,仅具备记录功能,无法自主分析。而如今多模态模型不断发展,尤其是轻量化多模态模型的出现,尺寸更小,使得大量上游厂商可以在 IPC 中内置多模态模型,让设备能基于监控画面快速判断是否存在异常。今年 3 月,阿里巴巴就与 KUMEROS 咖啡达成战略合作,为后者提供从门店运营到产品创新的全链路解决方案。

徐志远进一步补充,具体到百炼服务企业客户,目前头部是互联网行业,这是因为大量互联网公司本身就以新技术驱动业务增长;其次是新消费行业,如咖啡门店等能在小程序等用户触点中融入 AI 能力,帮助用户更好地完成消费,还依托自身基础设施在内部业务中落地相关应用。

徐志远还着重提到了消费电子领域,未来多模态组件等融入模型后,如 AI 玩具等 AI 消费设备有望实现增长。" 近期我们已经看到该行业涌现出大量需求,也正在做丰富的适配工作,以提升消费电子行业对模型的应用能力。" 徐志远说。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 阿里巴巴 阿里云 开源 编程
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论