中国网财经 前天
中国工程院院士谭建荣:没有小模型,哪来大模型?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

中国网财经 12 月 12 日讯 在近日举行的 " 超级连接 · 智见未来 "EVOLVE 2025 大模型与智能体产业创新峰会上,中国工程院院士、浙江大学教授谭建荣对当前如火如荼的大模型与智能体热潮进行了深度解读。谭建荣认为,虽然大模型引领了人工智能的新一轮发展,但千万不能忽视作为其根基的 " 小模型 ",同时指出人工智能的发展正从技术层面向产业化实践快速演进。

没有小模型,哪来大模型?这一设问直指人工智能发展的底层逻辑。在谭建荣看来,人工智能由数据、算法、算力三大支柱构成,而智能体正是三者融合落地的关键载体。当前以大模型为代表的技术突破,其根基正是长期以来在数据建模与小模型领域的积累。

谭建荣特别强调,生成式人工智能虽已能轻松通过图灵测试,在文本生成等方面超越普通人力,但其核心能力仍源于对数据的系统化 " 知识化 " 处理。数据本身是散乱的,需要通过建模转化为结构化的知识体系——这正是小模型所承担的基础工作。大模型的训练,实质上是在小模型建立的认知框架上,通过数百亿参数的规模扩展实现的量变到质变。

在技术演进层面,谭建荣指出人工智能正经历从因果推理到关联分析的范式转变。早期基于专家系统的开发路径因过度依赖明确的因果关系而受限,当前以大模型为代表的路径则通过大数据关联分析开辟了新可能。在这一过程中,深度学习与增强学习成为关键技术支撑,如 DeepSeek 正是通过增强学习与模型蒸馏实现了重要突破。

然而,技术突破也伴随着新的挑战。谭建荣提醒,自然语言理解尤其是中文语义的深层逻辑处理仍面临 " 幻觉 " 等风险。他以 " 说曹操曹操到 " 的语言理解难题为例,说明即便在大模型时代,对复杂语义的精准把握仍是待攻克的技术高峰。

面向未来,谭建荣认为智能体发展需要坚持 " 精准化 " 与 " 协同化 " 并重。一方面,大模型应用必须深入具体行业场景,开发面向垂直领域的智能体;另一方面,需要构建 " 云、边、端 " 协同的架构体系,实现计算资源的优化配置。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

人工智能 中国网财经 深度学习 中国工程院 院士
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论