快科技 1 月 16 日消息,今日,智谱宣布,其联合华为开源的新一代图像生成模型 GLM-Image,在开源不到 24 小时内,登上全球知名 AI 开源社区 Hugging Face(抱抱脸)榜单全球第一。
智谱表示,这是首次完全依托国产芯片训练的国产模型在国际舞台上取得榜首位置,标志国产 AI 模型的端到端自主研发能力在国际竞争中取得突破。
据了解,GLM-Image 基于昇腾 Atlas 800T A2 设备和昇思 MindSpore AI 框架完成从数据到训练的全流程,是首个在国产芯片上完成全程训练的 SOTA 多模态模型。

在模型架构上,GLM-Image 不同于开源常用的 LDM 方案,创新性地采用自回归 + 扩散解码器的混合架构,兼顾全局指令理解与局部细节刻画。
性能方面,GLM-Image 在 CVTG-2K(复杂视觉文本生成)和 LongText-Bench(长文本渲染)榜单获得开源第一,能够读懂指令,写对文字,尤其擅长汉字生成任务,可广泛应用于海报、PPT、科普图等知识密集型场景。
在商业化应用方面,GLM-Image API 调用模式下,单张图片生成成本仅为 0.1 元,大幅降低了企业和开发者使用先进图像生成技术的门槛。



