北京商报 04-01
澜舟科技开源孟子3-13B大模型支持免费商用
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

北京商报讯(记者 杨月涵)4 月 1 日,澜舟科技正式宣布 Mengzi3-13B 开源,对学术研究完全开放,同时支持免费商用。

今年 3 月 18 日,澜舟科技推出了其 " 一横 N 纵 " 孟子大模型系列及产品体系。其中," 一横 " 的核心——孟子大模型技术,经过高效迭代后,孟子大模型 V3 版本的 Mengzi3-13B 也正式与大家见面。

据介绍,相较于今年 1 月发布的孟子大模型 GPT V2 系列(包括孟子大模型 - 标准、孟子大模型 - 轻量、孟子大模型 - 金融、孟子大模型 - 编码),Mengzi3-13B 在数据集质量上有了显著的提升。其采用的 Mengzi-3 数据集规模高达 3T tokens,涵盖了网页、代码、书籍、论文等多元化、高质量的数据来源。

在 MMLU、Chinese-MMLU、GSM8K、HUMAN-EVAL 等多项公开数据集进行的模型效果评估中,Mengzi3-13B 均展现出了卓越的性能表现。在参数量 20B 以内的轻量化大模型领域,Mengzi3-13B 在中英文语言能力方面的成绩尤为突出,具备了出色的实用性和高性价比,能更好的满足企业的商业化需求。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

智慧云

智慧云

ZAKER旗下新媒体协同创作平台

相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论