3 月 31 日,智谱(即北京智谱华章科技有限公司)在中关村论坛上正式发布了智能体 "AutoGLM 沉思 ",其具备深度研究能力(Deep Research),同时实现实际操作,推动人工智能 Agent(智能体)进入 " 边想边干 " 的阶段。
对于 Agent 层面的探索,公司 CEO 张鹏在发言中表示,Agent 也存在类似 Scaling Law(规模定律)的特点,通过扩展训练时的 inference compute(推理计算),Agent 展现出了更强的性能。
张鹏表示,在 Agent Scaling Law 的基础上,他们进一步发现了 Agent 的能力。他举例称,在训练过程中,工作人员从未教过 AutoGLM 沉思访问巨潮资讯网。然而,当发送指令 " 帮我收集昨天关于具身智能的相关研报 " 时,AutoGLM 沉思能够规划出通过访问巨潮资讯网解决问题的方案。
AutoGLM 沉思的技术演进路径为:GLM-4 基座模型→ GLM-Z1 推理模型→ GLM-Z1-Rumination 沉思模型→ AutoGLM 模型。张鹏表示,其中核心链路的模型和技术将于 4 月 14 日正式开源,以此推动行业生态发展。
张鹏在发布会上表示,基于最新的技术积累,智谱重新训练了一个 320 亿参数的基座模型 GLM-4-Air-0414,在其预训练阶段加入了更多的代码类、推理类数据,并在对齐阶段针对智能体能力进行了优化,该模型在工具调用、联网搜索等智能体任务上的能力得到大大加强。
每日经济新闻
登录后才可以发布评论哦
打开小程序可以发布评论哦