IT时报 前天
国内最高规格计算机年度盛会 中国科学家和国家队追问AI终极命题
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

  大模型能通往 AGI 吗?

作者/   IT 时报    郝俊慧

编辑/   钱立富  孙妍

10 月 23 日,国内规模最大、规格最高、影响力最强的计算机领域年度盛会——中国计算机大会(CNCC2025)正式拉开帷幕,参会人数创下历史新高,突破 11000 人。

自 2003 年首次举办以来,CNCC 已走过 22 年,从早期的计算机体系结构、操作系统、数据库、软件,到近两年的数字经济、人工智能、具身智能、大数据…… CNCC 书写了一部浓缩的 " 中国 IT 史 ",而 AI 无疑是今年 CNCC 出现频次最高的关键词。

2025 年 10 月,ChatGPT 掀起 AI 飓风三年后,人工智能来到一个微妙的时间节点:LLM(大语言模型)能否通向 AGI(通用人工智能),甚至 ASI(超级人工智能),成为学界和业界争议的焦点。

站在 AGI 的十字路口,CNCC 的参会者们正试图回答这一终极命题。

大模型困境

AI 陷入 " 元认知陷阱 "

10 月 16 日,AI 三巨头之一、图灵奖得主约书亚 · 本吉奥领衔的研究团队发表重要论文《A Definition of AGI》(AGI 的定义),为 AGI 提出了一个清晰而直观的定义:AGI 是一个在认知通用性(versatility)和熟练度(proficiency)上,能够达到或超过一个受过良好教育的成年人水平的人工智能。

如果以此定义来看当前主流的大语言模型路径,优劣势呈现出明显的两极分化:在那些可以从海量数据中直接学习的领域,模型表现出了极高的熟练度;但在长期记忆存储(MS)这类能力上,无论是 GPT-4 还是 GPT-5,得分都是刺眼的 0%。

类似观点在 CNCC2025 上也被多次提及。

  " 大模型(参数规模超 10 亿的深度神经网络)虽已成为 AI 主流,但本质上仍然是拟合海量数据概率分布的‘统计相关性’工具,存在很多固有缺陷。"CCF 会士、中国工程院院士、同济大学教授郑庆华指出。

从 GPT-1 到 GPT-5,训练数据量累计增长达到了惊人的 9000 多倍,而人类高质量文本的增速却只有个位数,全球学术文献年增长率约 5%,维基百科信息量年增幅约 3%,人类生产数据的速度远远跟不上大模型对数据的 " 渴求 "。

与此同时,能源消耗问题也日益突出,同等规模下,大模型的能耗比人脑高出整整 5 个数量级。" 面对新任务的灾难性遗忘(喜新厌旧)、难以抽象出事物内在因果逻辑以及存在的幻觉,不适用于小数据、低算力、低带宽的场景。" 郑庆华以前段时间小米自燃事件举例," 虽然我们看到大量的现场图像,但真正跟爆炸相关的是当时汽车的状态数据,比如说燃料电池的状态数据、汽车电子控制系统的状态数据,这些数据其实采集不到,或者说样本很小。"

华为战略研究院院长周红表达了类似的观点,现有的大模型基于矩阵计算,这导致它难以得出自己知识范围之外的答案,比如它永远不可能从多面体的两面信息中预测出第三面。

" 当前的 AI 缺乏一种元认知能力,即意识到自己当前的方法不再有效。"《AIG 的定义》一文尖锐地指出了 LLM 大模型的僵化缺陷,这种 " 不自知 " 甚至会让大模型出现一种 " 能力的扭曲 ",利用其压倒性的优势能力(如巨大的工作记忆和计算速度)来掩盖或绕过其基础能力的根本性缺陷,从而制造出一种看似通用的脆弱假象。

前沿探索

从 " 具身智能 " 到 " 共身智能 "

当 AI 处于 " 不自知 " 状态时,人类科学家要如何打破这种 " 扭曲场 "?

  " 现有的大模型之外,有没有其他的人工智能发展路径?" 郑庆华之问,是在场诸多科学家们的共同思考。

  " 只有将概念转化为现实,一项新技术才真正诞生。" CCF 会士、中国工程院院士、北京航空航天大学教授赵沁平认为,当前的 AI 主要是基于数据和算法的 " 仿生智能 ",而 VR 是构建逼真环境的 " 仿真智能 ",难点在于如何将两者结合,让数字世界、物理世界和人类世界实现真正的三界融合。

目前科学界基本形成的共识是,AI 仿生只是对人脑神经元结构、数据和信息表征以及学习方式的模拟,但无法回答一些根本问题:" 为什么人脑不会发生灾难性遗忘?"" 为什么人脑记忆机制高度节能?"" 为什么人脑具有强推理能力?"

  " 记忆并非简单地存储,它其实是通过吸引子的形成和神经环路的可塑性来处理信息。" 吸引子是动力系统演化中的一种稳定状态,也可以理解为一种行为模式,郑庆华认为,人脑记忆(心智)形成的稳定状态(吸引子),具有抗噪性和联想功能,能从不完整、模糊的感知中回归到正确的记忆状态,从而实现对过去事物的抽象和检索。

郑庆华认为,如果借鉴人脑记忆的这种机理,便可以跳出 " 数据驱动 " 大模型的路径依赖,构建具有抽象联想、稀疏激活特征的机器记忆表征,他将此称为 " 机器记忆智能 "。

华为提出的方案是 " 融合三态 "。" 仅靠深度学习处理可表达、可感知的明知识远远不够," 周红认为,AI 对于可感知但难以表达的 " 暗知识 "(如直觉、经验),不可感知也不可表达的原理与第一性原理的 " 默知识 "(如物理定律、数学定理)的理解和运用能力还很差。目前,华为正在尝试推动深度学习与符号主义深度融合,构建能够理解和运用多种知识类型的综合人工智能系统。

赵沁平则提出了 " 共身智能 " 概念,在虚拟对象与物理对象之间建立实时数据通道,从而实现虚实联动的闭环,最终 AI 系统与人类形成双向互动、共同进化的伙伴关系,比如未来的 AI 眼镜不仅能提供信息,还能理解用户的意图和情境,进行更深层次的协作。

据介绍,美国食品药品监督管理局已开始推动用 AI 和 VR 技术取代动物实验,也就是在完全虚拟仿真的环境中模拟手术。更关键的是,虚拟手术平台能够基于患者的个性化病理模型进行手术方案预演和评估,这为解决 " 手术方案无法验证 " 这一医学难题提供了可能,同时也让年轻医生拥有几近无限的 " 实验空间 ",而患者也无需再成为医生成长的 " 试验田 "。

产业落地

算网协同 + 软硬一体

当然,至少在现阶段,尺度定律依然在人工智能领域发挥着显著作用。

中科曙光副总裁李斌指出,全球顶尖 AI 超级计算机性能每 9 个月翻一番,年增速达 2.5 倍,已经远超摩尔定律失效前超算黄金时期的峰值。

基于算力的国力之争,近两年来也日益激烈。最近,英伟达 CEO 黄仁勋便坦言,在中国的市场份额已经降为 " 零 "。

当国产算力逐步登上中国的算力舞台,新的问题是,如何在构建高效、安全的算力基础设施的同时,让它性价比最高?

国产算力不仅要好用,还要用得起。

" 现在产生一个 token 的成本,远高于传输一个 token 的成本。" 中国电信集团首席专家、天翼云科技有限公司助理总经理江峰算了一笔经济账," 这正是算力网络得以成立的关键——通过网络调度和优化,以稍高的传输成本换取算力投入的大幅降低,从而提升全社会的算力利用水平。"

中国电信自主研发的算力分发网络平台——息壤,便是天翼云作为云服务商国家队给出的答案。息壤支持对通用算力、智算、超算等不同类型算力进行统一调度,通过跨域异构算力资源整合,可以将中国电信的自有算力和第三方的算力连接起来,用户无需考虑资源、框架、工具等各类因素,只需提交任务,平台便可以根据用户场景自动完成各种适配,算力的接入和纳管达到分钟级。

据江峰透露,截至今年 8 月,天翼云息壤中可调度的算力已达 77EFLOPS,其中来自第三方的生态算力达 34EFLOPS。

算网之外,国产算力厂商也在探索新的路径。

今年 9 月 5 日,中科曙光发布了国内首个 AI 计算开放架构以及基于此架构的曙光 AI 超集群系统,核心在于联动 AI 产业链企业,以 GPU 为核心,从 " 算、存、网、电、冷、管、软 " 单点突破走向集群创新。实测数据显示,千卡集群大模型训推性能达到业界主流水平 2.3 倍,模型开发效率提升高达 4 倍,GPU 算效增加 55%,平均无故障时间(MTBF)提高 2.1 倍,平均故障修复时间(MTTR)降低 47%。

" 从硬件到系统的范式转变,叠加产业链协同,是当前国产智能超算系统发展的重要路径。" 李斌表示。

国产算力会就此走入开放的 " 安卓时代 " 吗?或许,这是一个好的开始。

排版/   季嘉颖

图片/   CNCC

来源/《IT 时报》公众号 vittimes

E   N   D

请加「星标」不错过我们

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 人工智能 三巨头 计算机 数字经济
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论