每日经济新闻 04-16
运营商大模型来了:电信开源12B星辰大模型 移动客服大模型可正式对外提供相关服务
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

来自运营商的大模型正在加速进入市场。4 月 16 日,《每日经济新闻》记者从中国电信处获悉,近日中国电信开源了 12B 参数规模星辰语义大模型 TeleChat-12B。相较于 1 月开源的 7B 版本,内容、性能和应用等方面整体效果提升了 30%。其中,多轮推理、安全问题等领域提升超 40%。另外,据了解,中国电信将于年内开源千亿级参数大模型。

根据中国电信提供的信息,TeleChat-12B 将 7B 版本 1.5T 训练数据提升至 3T,此次开源提供基础模型以及基于相应版本的对话模型,支持传统的全量参数更新及 LoRA 等只更新部分参数的高效微调方法;支持 Deepspeed 微调、支持 int8、int4 量化和国产芯片训练推理。中国电信方面表示,星辰语义大模型已应用于行文写作、代码编程、网络故障分析以及经营分析等场景。行文写作方面,平均生成字数超过 1500 字,有效采纳率为 85.7%。

同日,记者还从中国移动处获悉,近日,国家互联网信息办公室发布第五批境内深度合成服务算法备案信息公告,中国移动客服大模型算法通过服务提供者备案,标志着可正式对外提供生成式人工智能服务,成为央企首个全自研、全备案的行业大模型。

据中国移动方面介绍,中国移动客服大模型主要应用于面向客户的意图识别与多轮应答,是以 " 中国移动九天通用大模型 " 为底座,应用客服领域专业数据训练的客服行业专业大模型,具备百亿参数大模型的通用交互能力和覆盖中国移动全业务的专业客服能力。

去年以来,运营商切入大模型的意愿已经十分明显。中国电信就在 2023 年年报中表示,2024 年公司将把握以人工智能为代表的新一轮科技革命和产业变革趋势;另据东湖国家自主创新示范区官方微信公众号消息,中国移动九天人工智能团队将于 2024 年底对标 GPT-4 完成多模态大模型训练,含 8 款子平台、287 项核心算法能力、37 项规模化应用,提供从智算基础设施、核心算法能力到智能化应用的全栈人工智能服务,可服务政务、工业、教育、医疗等多个领域。

每日经济新闻

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

智慧云

智慧云

ZAKER旗下新媒体协同创作平台

相关标签

中国移动 中国电信 人工智能 开源 芯片
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论