三易生活 11-03
百川智能推出“1+3”产品矩阵,助力B端私有化部署
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

日前 AI 初创公司百川智能方面宣布推出 "1+3" 产品矩阵,即包含全链路优质通用训练数据、Baichuan4-Turbo 和 Baichuan4-Air 两款模型,以及全链路领域增强工具链在内的一站式大模型商业化解决方案。据官方透露,该方案能够帮助企业以最低的成本实现效果最佳的私有化部署。

据悉,由于直接应用通用模型无法达到理想效果,因此企业往往必须对模型进行定制化优化、使其适应特定领域和场景需求。为了解决企业难以获得与原模型高度匹配的通用训练数据这一关键问题,百川智能方面将自用的优质预训练数据、SFT 微调数据、强化学习中的通用训练数据,以及自研的超参自动化搜索和调优技术、数据动态自适应配比技术等统一封装,打造了一套全链路优质通用训练数据方案。

根据百川智能方面公布的信息显示,这一通用训练数据不仅与 Baichuan4-Turbo、Baichuan4-Air 的数据分布高度一致,还能够与企业私有数据混合微调,使得模型在多场景下的可用率得到极大提升,其中在金融、教育、医疗等场景的专业细分任务平均可用率高达 96%。

而在成本方面,Baichuan4-Turbo 部署成本和 Baichuan4-Air 推理成本均为行业同梯队最低,其中 Baichuan4-Turbo 在文本生成、知识问答、多语言处理、数据分聚类等核心能力上均有显著提升,只需 2 卡 RTX4090 的算力即可部署,并且在实现首 Token 速度较 Baichuan 4 提升 51%、Token 流速提升 73% 的同时,推理成本也只有后者的 15%,而 Baichuan4-Air 的推理成本更是仅有 Baichuan 4 的 1%、百万 Token 仅需 0.98 元。

此外为了解决部分企业稀缺专业人才、模型调优技术门槛高等痛点,百川智能还推出了简单易用的全链路领域增强工具链。据了解,这一工具链集成了数据抓取、数据清洗、数据增强、模型训练、模型评测、模型压缩和模型部署等诸多工具,企业可直接根据需求自由选择相应工具,对模型进行加密部署和训练。

此外值得一提的是,该工具链还通过大量适配工作解决了不同硬件的适配问题,目前能够高效适配英伟达 RTX4090、A、H 系列、华为昇腾、寒武纪、高通、MTK、天数等多种主流算力芯片。

【本文图片来自网络】

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

逗玩.AI

逗玩.AI

ZAKER旗下AI智能创作平台

相关标签

百川智能 效果 寒武纪 高通 英伟达
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论