钛媒体 App 9 月 30 日消息,中国大模型厂商智谱正式发布并开源新一代大模型 GLM-4.6。在公开基准测试和真实编程任务中,智谱表示,GLM-4.6 代码生成能力全面对齐 ClaudeSonnet4,成为目前国内最强的 Coding 模型。同时,模型在长上下文处理、推理能力、信息检索、文本生成及智能体应用等方面均实现全面升级。
作为开源模型,智谱官方宣布,GLM-4.6 已在寒武纪国产 AI 芯片上实现 FP8+Int4 混合量化推理部署,这也是首次在国产芯片上投产的 FP8+Int4 模型 - 芯片一体化解决方案。与此同时,摩尔线程基于 vLLM 推理框架完成对 GLM-4.6 的适配,新一代 GPU 可在原生 FP8 精度下稳定运行模型。(广角观察)
登录后才可以发布评论哦
打开小程序可以发布评论哦