快科技 7 月 2 日消息,近日,发布两个月的文心 4.5 系列模型正式开源,包括 47B、3B 激活参数的 MoE 混合专家模型与 0.3B 参数的稠密模型等 10 款,而就在文心大模型开源首日,龙芯中科与百度启动了技术合作,基于最新发布的龙芯 3C6000 系列。
双方将共同推进国产算力基础设施与大模型技术的融合创新,为 AI 产业化应用提供安全可控的 " 中国芯 " 解决方案。
据悉,百度文心 4.5 系列模型均使用飞桨深度学习框架进行高效训练、推理和部署。在大语言模型的预训练中,模型 FLOPS 利用率 ( MFU ) 达到 47%。
实验结果显示,文心 4.5 系列模型在多个文本和多模态基准测试中达到 SOTA 水平,在指令遵循、世界知识记忆、视觉理解和多模态推理任务上效果尤为突出。
核心技术点包括:多模态混合专家模型预训练、高效训练推理框架、针对模态的后训练。
龙芯 3C6000 与文心 4.5 系列开源模型的技术合作,标志着龙芯 CPU 在 AI 算力领域取得实质性突破。
未来,双方将持续推动大模型在生产场景中的规模化应用,为促进国产 AI 生态繁荣发展贡献力量。
龙芯 3C6000 系列处理器具有高性能、高可靠、高安全、全自主等特点,采用自主龙架构指令集、自主工艺,单硅片最多 16 核心 32 线程,可双硅片、四硅片整合封装,单芯片最多 64 核心 128 线程,并支持双路、四路并行,一套系统即可做到 128 核心 256 线程。
龙芯 3C6000 系列可满足通算、智算、存储、工控、工作站等多场景的计算需求,并获得了《安全可靠测评公告》当前最高等级Ⅱ级认证。
登录后才可以发布评论哦
打开小程序可以发布评论哦