才开年没几天,这帮搞 AI 的就坐不住了。
上周末,智谱 AI 联合清华大学基础模型北京市重点实验室,搞了个 AGI Next 前沿峰会,传说中的 " 开源四杰 ",一下就来了三家。
清华大学教授、智谱创始人唐杰,月之暗面创始人杨植麟,还有阿里 Qwen 的技术负责人林俊旸,一个个都是名头响当当的人物。
除此之外,这段时间风头正盛的腾讯 CEO 办公室首席科学家姚顺雨,回国后也首次公开露脸,带来了一些让人感到 " 头大 " 的操作。
人没到场,只露了脸。。。照片里看起来头最大的那个人就是他。

当然,现场也不乏学术界的代表,像加拿大皇家学院院士、香港科技大学荣休教授杨强,还有清华大学教授、院士张钹。
91 岁的张院士虽然自嘲 " 早已经被替代了 " ,但说出来的话相当犀利,直言现在的大语言模型并不是人类语言的真正模型。
这群大佬凑在一块,没有把时间浪费在商业互吹上,更多的是聊技术路线、新的范式。比如 Chat AI 基本上到头了,接下来应该往哪走?再比如咱们虽然显卡没美国多,但穷则思变搞不好能憋出大招。。。
这么说吧,他们把之后 AI 可能会怎么发展,给提前 " 剧透 " 了一部分。
隔壁咱们也正好去了现场,今天也一起来看看会上都有哪些干货。
"Chat 范式快到头了 ",这是智谱创始人唐杰在现场抛出的一个暴论。

在他看来,随着 DeepSeek 的横空出世,大家做得再好,更个性化、更有情感,无非就是在对话上修修补补,玩不出什么新花样。
至于新范式,说白了就是让 AI 干活儿。
过去一年,不管是写代码的 Coding,还是能处理复杂任务的 Agentic,其实都是在往这个方向走。

圆桌会议上,主持人就针对 Agent 抛了一个很高的预期:到了 2026 年,能不能让它跑个几天几夜,把人类一两周的工作量给干了?
不过在 Agent 这事儿上,大佬们没有盲目画饼,而是抛出了几个冷思考。
世超斗胆总结下,就是别拿大炮轰蚊子。
在 Qwen 技术负责人林俊旸看来,Agent 真正的机会,不在于那些大家都能想到的头部需求,而是那些翻遍全网都找不到解决方案的长尾问题。

而从性价比的视角来看,如果一个简单的需求,也非要让 AI 在后台烧钱推理半天,这笔买卖显然也是不划算的。
不过现在更大的问题可能是,AI 还没那么聪明,要实现这种能干活的 AI,是继续无脑堆显卡、堆数据吗?
一直以来,大力出奇迹的 Scaling,都被业内看作是提高模型智能水平的有效手段。但峰会现场,唐杰却认为这是 " 人类偷懒的一种方法 "。
因为光靠堆料带来的收益正在变低,如果还只盯着参数量,不去找新的范式,那其实就是一种思维上的懒惰。
在这一点上,杨植麟说得可能更具体。

他们通过 Token efficiency(Token 效率)和 Long Context(长上下文),来实现更好的 Agent 智能。
具体来说,Token efficiency 就是指在遵循 Scaling Law 的前提下,让模型在有限的训练数据里,把智商上限拉得更高 。为此,Kimi 甚至搞出了新的二阶优化器 MUON 和线性注意力机制,愣是把效率提升了 2 倍。
说人话就是,少吃草,多挤奶。
除了抠效率,这次峰会," 自主学习 " 也是被反复提及的关键词之一。
啥叫自主学习?简单来说,就是让 AI 自己悟道。

听起来有点超前,但姚顺雨直接甩出了两个已经实现了的案例:
一个是 ChatGPT,正在利用海量的用户对话数据,不断地进行自我微调和风格适应。另一个更狠,在 Claude 这个项目里,有 95% 的代码其实是 Claude 自己写的。

按照姚顺雨的说法,在硅谷大街小巷的咖啡馆里,自主学习已经成为了一种共识。
而当被问到,谁最可能引领这个新范式时,姚顺雨也给出了一个判断:虽然 OpenAI 的创新基因可能因为商业化被削弱了,但它仍然是那个最有可能的选手。
聊完技术,咱们还得聊聊大模型在产业端的情况。
现场,姚顺雨就提到了他对于模型分化的两个观察。
一个是 C 端对模型智能的钝感力,换句话说,大模型的能力具体变强了多少,多数 C 端用户是感受不到的。
面向 C 端用户的产品,模型智商提高 10 分还是 20 分,对用户来说区别不大。有时候一个 80 分的模型配合丝滑的交互,体验反而可能会吊打 90 分的模型。

但在 ToB 领域,就不一样了,强弱分化很明显。
在这里,模型越强,代表着能解决的任务越多,产生的价值就越大。所以,谁家模型能帮程序员把写代码的效率,哪怕只提升 10%,企业也愿意掏钱。
另外一个,则是垂直整合和模型应用分层两条路径的分化。
ToB 的垂直整合未必成立,尤其对于生产力场景来说,模型层和应用层需要的能力不太一样。但在 ToC 应用上,垂直整合还是成立的,无论是 ChatGPT 还是豆包,模型和产品都在非常强耦合地紧密迭代。
最后,一个敏感但避不开的问题,就是 AI 的中美竞争,几位嘉宾也没藏着掖着。
唐杰很坦诚,在他看来,虽然国内在开源上有了一些成绩,但实际上中美差距可能还在拉大。
那咱们缺的是啥?显卡吗?

是,也不是。比起显卡,咱们更缺的其实是胆子。
姚顺雨直言,国内团队复现技术那叫一个快,只要一个技术被证明是可行的,咱们一拥而上能做得更好。
但如果是个不确定的新范式,大家就不敢碰了。说白了,就是缺了点冒险精神。
不过林俊旸最后,还是给了国内一个 20% 的胜率。
咱们国内团队虽然不像美国巨头那样富得流油,显卡随便烧,但穷也有穷的活法。
正是因为资源有限,逼得大家必须在算法和架构上抠细节,这种被逼出来的创新,搞不好能比那些显卡大户搞出来的东西更扎实。

反正通过这场坦白局,世超对之后 AI 的发展可以说是非常兴奋了。
新的范式正在破土而出,大模型可能会迎来比想象中更具突破性的进展。大家不再迷信那些静态的排行榜和跑分,而是更关注模型在真实世界里,解决复杂问题的能力。。。
也许在不远的将来,当我们回望今天,就会发现我们正站在人类历史的变革前夜。


登录后才可以发布评论哦
打开小程序可以发布评论哦