清华教授唐杰最新在微博发表了自己关于 AI 的一些感悟,非常值得一读~
共八个小点,不算长篇大论,但扎实有料:
基座模型继续 scaling 仍然高效;
真实使用体验想进一步上台阶,长尾能力的对齐和推理增强绕不过去;
Agent 代表模型开始进入环境、开始形成生产力;
一旦模型进入持续交互的世界,记忆机制、在线学习、自我评估就会成为核心工程题,而不是可选项;
AI 终究要落到替人完成工作、创造增量价值上;
领域大模型是个伪命题;
……
唐杰表示,发微博是想分享一下,希望对大家有用。
兹以推文刊载,供大家广泛阅读、传播。

以下为其感悟原文:
01,关于 scaling 基座模型
预训练使得大模型已经掌握世界常识知识,并且具备简单推理能力。
更多数据、更大参数和更饱和的计算仍然是 scaling 基座模型最高效的办法。
02,关于激活对齐和增强推理能力
激活对齐和增强推理能力,尤其是激活更全面的长尾能力是保证模型效果的另一关键,通用 benchmark 的出现一方面评测了模型通用效果,但也可能使得很多模型过拟合。
真实场景下是如何让模型更快、更好的对齐长尾的真实场景,增强实际体感。
mid 和 post training 使得更多场景的快速对齐和强推理能力成为可能。
03,关于 Agent
agent 是模型能力扩展的一个里程碑,也是体现 ai 模型进入人类真实(虚拟 / 物理)世界的关键。
没有 agent 能力,大模型将停留在(理论学习)阶段,就类似一个人不断学习,哪怕学习到博士,也只是知识积累,还没有转化为生产力。
原来的 agent 是通过模型应用来实现,现在模型已经可以直接将 agent 数据集成到训练过程,增强了模型的通用性,其实难题还是不同 agent 环境的泛化和迁移并不是那么容易,因此最简单办法也只有不断增加不同 agent 环境的数据和针对不同环境的强化学习。
04,关于模型记忆
实现模型记忆成为一个必须做的事情,这也是一个模型应用到真实环境必须有的能力。
人类记忆分为短期(前额叶)、中期(海马体)、长期(分布式大脑皮层)、人类历史(wiki 或史书)四个阶段。
大模型如何实现不同阶段的记忆是个关键,context、rag、模型参数可能分别对应了人类的不同记忆阶段,但如何实现是个关键,一种办法是压缩记忆,简单存在 context,如果大模型可以支持足够长的 context,那基本有可能实现短中长期的记忆。
但如何迭代模型知识,更改模型参数这还是个难题。
05,关于在线学习与自我评估
在线学习与自我评估。
有了记忆机理,在线学习成为一个重点,目前的大模型定时重新训练,这有几个问题:
模型无法真正的自我迭代,但模型的自学习自迭代一定会是下一个阶段必然具有的能力;
重新训练还比较浪费,同时也会丢掉很多交互数据。
因此如何实现在线学习是个关键,自我评估是在线学习的一个关键点,要想模型自我学习,模型首先要知道自己对还是不对,如果知道了(哪怕概率知道)模型就知道了优化目标,能够自我改进。
因此构建模型自我评价机制是个难题。
这也可能是下一个 scaling 范式。
continual learning/real time learning/online learning?
06,关于模型研发和应用结合
最后,大模型的发展越来越端到端,不可避免的要把模型研发和模型应用结合起来。
ai 模型应用的第一性不应该是创造新的 app,他的本质是 agi 替代人类工作,因此研发替代不同工种的 ai 是应用的关键。
chat 部分替代了搜索,部分其实融合了情感交互。
明年将是 ai 替代不同工种的爆发年。
07,关于多模态和具身
写在最后的是多模态和具身。
多模态肯定是个未来也很有前景,当下的问题是多模态不大能帮助到 agi 的智能上界,而通用 agi 的智能上界到底在哪儿还不知道。
可能最有效的方式还是分开发展,文本、多模态、多模态生成。
当然适度的探索这三者的结合肯定能发现一些很不一样的能力,这需要勇气和雄厚的资本支持。
同理,如果看懂了 agent 就知道具身的痛在哪里了,太难通用了(也不一定),但至少少样本去激活通用具身能力基本不可能。
那怎么办呢,采数据,或者合成数据,都不是那么容易,也贵。
但反之一旦数据规模上去了,通用能力出来了自然会形成门槛。
当然这只是智能方面的难题,对于具身,机器人本身也是个问题,不稳定,故障频繁都限制了具身智能的发展。
2026 年这些都将取得长足进步。
08,关于领域大模型和大模型应用
也讨论一下领域大模型和大模型应用。
我一直认为领域大模型就是个伪命题,都 agi 了哪有什么 domain-specific agi ……
但,agi 还没实现,领域模型会长时间存在(多长,不好说,ai 发展实在太快了)。
领域模型的存在本质上是应用企业不愿意在 ai 企业面前认输,希望构建领域 know how 的护城河,不希望 ai 入侵,希望把 ai 驯化为工具。
而 ai 的本质是海啸,走到哪里都将一切卷了进去,一定有一些领域公司走出护城河,自然就卷进了 agi 的世界。
简而言之,领域的数据、流程、agent 数据慢慢的都会进入主模型。
而大模型的应用也要回到第一性原理,ai 不需要创建新的应用。
ai 的本质是模拟人或者代替人或者帮助人实现人类的某些必须要做到事(某些工种)。
可能就是两种,一种就是 ai 化以前的软件,原来需要人参与的改成 ai,另一种就是创造对齐人类某个工种的 ai 软件,替代人类工作。
所以大模型应用需要帮助到人、创造新的价值。
如果做一个 ai 软件没人用,不能产生价值,那这个 ai 软件肯定没有生命力。
参考链接:
https://weibo.com/2126427211/5247011059141988
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!
— 完 —
专属 AI 产品从业者的实名社群,只聊 AI 产品最落地的真问题 扫码添加小助手,发送「姓名 + 公司 + 职位」申请入群~

进群后,你将直接获得:
最新最专业的 AI 产品信息及分析
不定期发放的热门产品内测码
内部专属内容与专业讨论
点亮星标
科技前沿进展每日见


登录后才可以发布评论哦
打开小程序可以发布评论哦