钛媒体 10-31
模型推理成本下降最高99%!百川智能发布一站式大模型商业化解决方案
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

百川智能创始人、CEO 王小川

10 月 31 日消息,钛媒体 App 获悉,王小川创立的通用 AI 公司百川智能今天发布包括 Baichuan4-Turbo、Baichuan4-Air 两款模型在内的一站式大模型商业化解决方案,即 1+3 产品矩阵(全链路优质通用训练数据,Baichuan4-Turbo、Baichuan4-Air 两款模型和全链路领域增强工具链)。

百川智能表示,相比 Baichuan4,Baichuan4 Turbo 模型效果提升 50%,推理成本下降 85%,首 Token 速度提升 51%,Token 流速度提升 73%;Baichuan4 Air 是首创 PRI(金字塔、残差、区间)、MoE(混合专家)架构模型,效果持平下推理成本下降 99%,首 Token 速度提升 77%,Token 流速度提升 93%。同时,企业可以将两款模型进行调优和增强,百川智能 1+3 产品矩阵将模型多场景可用率提升到 96%。

百川智能创立于 2023 年 4 月 10 日,由搜狗公司创始人、前 CEO 王小川创立,旨在打造中国版的 OpenAI,构建中国最好的大模型底座,帮助大众轻松、普惠地获取世界知识和专业服务,并在医疗与行业领域应用落地。

公司成立以来,百川智能以月度为单位相继推出 14 款大模型,包括 Baichuan-7B/13B、Baichuan2-7B/13B、Baichuan3 系列、Baichuan-53B、Baichuan2-53B、Baichuan2-192K、Baichuan2-Turbo、Baichuan-NPC 等,涵盖开源、闭源、学术科研、国产算力等多个维度。

当前,百川智能业务方向主要是 " 超级智能 + 超级应用 " 双轮驱动,发力领域(AI 顾问)和医疗大模型(AI 医生)。

模型领域,今年 5 月,百川智能发布多模态能力的 Baichuan 4 模型,通用能力提升超过 10%,数学和代码能力分别提升 14% 和 9%,基准评测中,模型能力位列国内第一。同时,百川已经推出首款 AI 助手 " 百小应 ",不仅支持多步搜索、智能定向搜索等能力,而且希望让 AI 从工具变为伙伴,逐步具备完整能力。

医疗领域,今年 7 月,百川智能首次对外展示 To B 端 AI 健康顾问,基于自研的通用医疗增强大模型产品。

融资方面,截至目前,百川智能已公布以 200 亿估值开启 B 轮融资,公开融资总额已超过 50 亿元人民币,投资方包括阿里、腾讯、小米、深创投、基石资本等机构,已跻身于大模型独角兽行列。

具体到此次产品上,由于 Baichuan4-Turbo、Baichuan4-Air 均为百川智能自研,所以这些优质通用训练数据与两者的数据分布高度一致,结合超参动态搜索和自适应配比等算法,与企业私有数据混合微调,显著提升了两个模型多场景下的可用率,在金融、教育、医疗等场景下的专业细分任务平均可用率高达 96%,位居行业首位。

Baichuan4-Turbo 的文本生成、知识问答、多语言处理等核心能力相比 Baichuan 4 均有显著提升,只需 2 卡 4090 的算力即可完成部署,在 GPT-4o 同档位效果的模型中部署成本最低,非常适合企业探索复杂场景。

Baichuan4-Air 百川智能的首个 MoE 模型,首创了 PRI 架构,即 Pyramid(金字塔架构)、Residual(残差结构)、Interval(区间结构),与标准的 MoE 架构相比保持了 MLP(多层感知机)和 Attention(注意力机制)的内部结构不变,在相同训练数据下,Baichuan4-Air 不仅时效率更高,性能也大幅领先于 GPT4-style、Mixtral-style 结构的 MoE 模型,更适用于已经验证过的较大规模流量的场景,其效果与 Baichuan 4 基本持平,但推理成本行业最低,仅为 Baichuan 4 的 1%,百万 Token 只需 0.98 元。

硬件层面,百川智能通过大量适配工作解决了不同硬件的适配问题,目前能够高效适配英伟达 4090/A/H 系列、华为昇腾、寒武纪、高通、MTK、天数(智芯)等企业的多种主流 AI 芯片。

商业化层面,目前百川智能已经服务了数千家客户,包括北电数智、完美世界游戏、爱奇艺、360 集团、生学教育、爱学堂等,并且与信雅达、用友、软通动力、新致软件、达观数据、华胜天成等多家行业生态伙伴,以及华为、中科曙光等硬件厂商,中国移动、中国电信、中国联通等运营商达成合作,构建百川大模型生态。

百川智能强调,全新的一站式解决方案,能够帮助企业以最低成本实现效果最佳的私有化部署,并支持企业将专有数据与百川智能自用的全链路优质训练数据混合,实现行业更高的多场景可用率。

(本文首发于钛媒体 App,作者|林志佳,编辑|胡润峰)

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

逗玩.AI

逗玩.AI

ZAKER旗下AI智能创作平台

相关标签

百川智能 医疗 融资 ceo
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论