
智东西
作者 | 江宇
编辑 | 漠影
在全球 " 科技春晚 " 国际消费电子展(CES)上,黄仁勋在主题演讲中提出一个引发热议的判断:"物理 AI 的 ChatGPT 时刻" 即将到来。
与之呼应,北京智源人工智能研究院发布的《2026 人工智能十大趋势》也提出了一致的观察——人工智能的演进核心正发生关键转移:从追求参数规模的语言学习,迈向对物理世界底层秩序的深刻理解与建模,行业技术范式迎来重塑。
智源研究院院长王仲远在发布会上称," 基础模型的竞争,焦点已从‘参数有多大’转变为‘能否理解世界如何运转’。我们正从‘预测下一个词’跨越到‘预测世界的下一个状态’。"

这意味着,AI 的演进方向正在发生结构性转变。以 " 下一状态预测 "(Next-State Prediction, NSP)为代表的机制,正在推动 AI 从感知数字世界,进一步走向理解并规划物理世界中的因果变化。
在这份指引行业未来的趋势报告中,蚂蚁集团作为关键的产业实践代表被多次提及。其在大模型、超级应用、AI 安全等关键趋势上的系统性布局与扎实成果,为报告预判的未来提供了具象化的 " 实践答卷 "。
一、范式跃迁:AI 从 " 数字感知 " 迈向 " 物理理解 "
报告认为,2026 年将是 AI 从数字世界迈入物理世界、从技术演示走向规模价值的关键分水岭。这场跃迁背后,智源总结出三条主线:
第一,AI 的 " 认知方式 " 变了。
过去 AI 擅长处理静态的语言、图像,现在则开始尝试预测 " 下一步会发生什么 "。这就是以世界模型与 NSP(Next-State Prediction)为代表的新方向。AI 不只是识图识话,而是要理解物体怎么动、行为如何演化,为自动驾驶仿真、机器人学习等物理任务提供 " 预判力 "。
第二,AI 的 " 形态 " 变了。
AI 正从一段段代码,变成能走能动的机器人;从单打独斗的智能体,变成可以分工协作的 "AI 团队 "。像通用人形机器人这样的产品,开始走进工业场景,不再只停留在实验室。而在软件层面,多智能体(MAS)间的标准化通信协议也逐渐成型,让 AI 之间可以像人类小组一样完成科研、工业等复杂任务。
最后,AI" 创造价值 " 的方式也在变。
在消费端,一个 "All in One" 的超级应用入口正在形成,成为巨头角逐的焦点。在企业端,越过早期概念验证的 " 幻灭期 " 后,AI 正凭借完善的数据治理与行业标准接口,在垂直领域孕育出真正可衡量商业价值的产品(MVP)。
那么,这十大趋势具体指向了哪些方向?我们不妨来看看。

二、技术前沿:四大支点重塑 AI 基础能力
趋势 1:世界模型成为 AGI 共识方向,Next-State Prediction 或成新范式
行业共识正从语言模型转向能理解物理规律的多模态世界模型。" 下一状态预测 " 标志着 AI 开始掌握时空连续性与因果关系,从感知走向认知。
趋势 2:具身智能迎来行业 " 出清 ",产业应用迈入广泛工业场景
具身智能正脱离实验室演示,进入产业筛选与落地阶段。随着大模型与运动控制、合成数据结合,人形机器人将于 2026 年突破 Demo,转向真实的工业与服务场景。
趋势 3:多智能体系统决定应用上限,Agent 时代的 "TCP/IP" 初具雏形
复杂问题的解决依赖多智能体协同。随着 MCP、A2A 等通信协议趋于标准化,智能体间拥有了通用 " 语言 "。多智能体系统将突破单体智能天花板,在科研、工业等复杂工作流中成为关键基础设施。
趋势 4:AI Scientist 成为 AI4S 北极星,国产科学基础模型悄然孕育
AI 在科研中的角色正从辅助工具升级为自主研究的 "AI 科学家 "。构建自主的科学基础模型体系已成为紧迫的国家战略需求。
二、产业落地:蚂蚁 " 超级应用 + 垂直闭环 " 的双轨验证
趋势 5:AI 时代的新 BAT 趋于明确,垂直赛道仍有高盈利玩法
C 端 AI 超级应用的 "All in One" 入口成为巨头角逐焦点。海外以 OpenAI 的 ChatGPT 与 Google Gemini 为引领,通过深度集成各类服务,塑造了一体化智能助手的新范式。而国内字节、阿里、蚂蚁等也依托生态积极布局,AI 时代的 " 新 BAT" 格局正在形成。
在这一趋势中,蚂蚁推出的 "灵光" 与 "阿福" 分别成为通用入口与垂类场景并行验证的代表案例。
全模态 AI 助手 " 灵光 ",精准切入 AI 应用 " 重聊天、轻行动 " 的痛点。上线首周下载量即突破 200 万,深受用户喜爱。其核心功能 "闪应用",允许用户通过自然语言快速生成可交互的轻应用,大幅降低开发门槛,带动 "全民手搓 AI 应用" 的风潮。加之其全模态信息生成能力,让交互更高效、体验更具 " 信息美感 ",从而回应了用户对 AI 实用性的根本期待。
" 蚂蚁阿福 ",则聚焦医疗健康领域,定位为 "AI 健康朋友 "。目前,其 App 月活用户已快速突破 3000 万,单日健康问答量超 1000 万。
为了让健康服务更专业、可信,阿福自研专用底座大模型,还与全国院士、名医深度共创,连接了超 5000 家医院资源、50 万真人医生和 500 位名医 AI 分身,形成从专业问答到医疗服务的完整闭环。
" 灵光 " 与 " 阿福 " 的并行探索,清晰地勾勒出 AI 价值兑现的两条可行路径:一是通过产品创新打造普适的超级入口,二是在垂直领域构建坚实的专业与服务壁垒。二者共同为 " 实用 AI" 时代提供了扎实的产业样本。
趋势 6:产业应用滑向 " 幻灭低谷期 ",2026H2 迎来 "V 型 " 反转
企业级 AI 应用在经历概念验证热潮后,正因数据、成本等问题正步入 " 幻灭低谷期 "。但随着数据治理与工具链成熟,预计 2026 年下半年将迎来转折,一批真正可衡量价值的 MVP 产品将在垂直行业规模落地。
三、关键支撑:蚂蚁在推理与安全上的系统性构筑
趋势 7:合成数据占比攀升,有望破除 "2026 年枯竭魔咒 "
高质量真实数据面临枯竭,合成数据正成为模型训练的核心燃料。" 修正扩展定律 " 为其提供了理论支撑。尤其在自动驾驶和机器人领域,由世界模型生成的合成数据,将成为降低训练成本、提升性能的关键资产。
趋势 8:推理优化远未触顶," 技术泡沫 " 是假命题
推理效率仍是 AI 大规模应用的核心瓶颈与竞争焦点。通过算法创新与硬件变革,推理成本持续下降,能效比不断提升。这使得在资源受限的边缘端部署高性能模型成为可能,是 AI 普惠的关键前提。
这一趋势在蚂蚁百灵大模型体系中得到充分印证。百灵大模型体系涵盖了Ling(语言)、Ring(思考)、Ming(多模态)三大系列。
其语言模型 Ling 系列采用高稀疏度 MoE 等高效架构,基于二十万亿 Tokens 语料训练,并推出了包含万亿参数模型 Ling-1T 与 Ring-1T 在内的完整产品矩阵。蚂蚁团队首创的 "棒冰算法(icepop)" 有效提升了模型稳定性。百灵大模型在 Hugging Face 等社区榜单上表现亮眼,其中 Ling-1T 曾持续登顶总榜,展现了强大的工程实力与社区认可度。
正如蚂蚁百灵大模型负责人张志强在圆桌会谈中指出," 灵光闪应用 "30 秒生成的极致体验,其根基正是模型推理效率的持续提升。蚂蚁团队在架构注意力机制的线性化、长上下文优化等方向的长期工程坚持,是支撑上层 Agent 能力进化的关键前提。

趋势 9:开源编译器生态汇聚众智,异构全栈底座引领算力普惠
为打破算力垄断与供应风险,构建兼容异构芯片的软件栈至关重要。繁荣的算子语言与趋于收敛的编译器技术正在降低开发门槛。以智源 FlagOS 为代表的平台,致力于构建软硬解耦、开放普惠的 AI 算力底座。
趋势 10:从幻觉到欺骗,AI 安全迈向机制可解释与自演化攻防
AI 安全风险已从 " 幻觉 " 演变为更隐蔽的 " 系统性欺骗 "。技术上,Anthropic 的回路追踪研究致力于从内部理解模型机理;OpenAI 推出自动化安全研究员。产业上,智源研究院联合全球学者发布 AI 欺骗系统性国际报告,警示前沿风险。安全正内化为 AI 系统的免疫基因。
蚂蚁在此领域构建了贯穿线上与终端的立体防线:
在系统防护方面,蚂蚁集团推出的大模型安全解决方案 "蚁天鉴" 已升级为面向智能体时代的一体化安全解决方案,基于 " 以攻促防 " 的安全理念,构建了 " 对齐 - 扫描 - 防御 " 技术栈形成全流程防护体系。
在终端安全方面,面对AI 眼镜等新一代智能终端快速增长带来的安全挑战,蚂蚁发布的全球首个智能终端可信连接技术框架 gPass,具备 " 安全、交互、互连 " 三大核心能力,支持 AI 眼镜与智能体之间的实时可信通信,打通用户与设备、模型与服务之间的安全连接链路。gPass 也为 AI 眼镜厂商与开发者提供统一、安全的底层架构,构建面向个人智能体时代的安全 AI 数字服务生态。
结语:AI 下半场来了
回看智源提出的这十大趋势,可以发现一个清晰的指向:AI 正在进入下半场。
一方面,世界模型、NSP、具身智能、多智能体系统与 AI Scientist,正在重塑 AI 理解世界、行动执行与协同合作的底层机制;另一方面,超级应用、垂直场景、推理优化、安全架构与算力底座,则决定这些能力能否被真正部署、持续运行,并与产业深度融合。
当 AI 不仅能 " 看懂世界 ",还能被系统性地嵌入应用、嵌入组织、嵌入终端设备,这场从数字世界迈向物理世界的跃迁,也就真正进入了下半场。


登录后才可以发布评论哦
打开小程序可以发布评论哦