9 月 30 日,《每日经济新闻》记者获悉,国内大模型企业智谱正式发布并开源新一代大模型 GLM-4.6,在 Agentic Coding (代理式编码)等核心能力上实现大幅跃升。
智谱官方宣布,GLM-4.6 已在寒武纪 AI 芯片上实现 FP8+Int4(一种混合精度计算技术)混合量化推理部署,这也是首次在国产芯片上投产的 FP8+Int4 模型—芯片一体化解决方案。在保持模型精度不变的前提下,该方案大幅降低了推理成本,为国产芯片本地化运行大模型提供了可行路径和示范意义。
与此同时,摩尔线程基于 vLLM 推理框架完成了对 GLM-4.6 的适配,新一代 GPU 可在原生 FP8 精度下稳定运行模型,充分验证了 MUSA( ( Meta-computing Unified System Architecture, 元计算统一系统架构)架构及全功能 GPU 在生态兼容性和快速适配能力方面的优势。
寒武纪与摩尔线程完成对 GLM-4.6 的适配,标志着国产 GPU 已具备与前沿大模型协同迭代的能力,加速构建自主可控的 AI 技术生态。GLM-4.6 搭配国产芯片的组合将率先通过智谱 MaaS 平台面向企业与公众提供服务。
每日经济新闻
登录后才可以发布评论哦
打开小程序可以发布评论哦