全球TMT 07-28
移远通信与RWKV共同推动大模型在端侧设备的低资源占用部署
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

(全球 TMT2025 年 7 月 28 日讯)7 月 27 日,移远通信宣布与 RWKV 公司建立全面合作关系,双方将依托移远的算力平台,优化并支持 RWKV 最新模型架构,共同推动大模型在端侧设备的低资源占用部署。此次合作成果于 2025 世界人工智能大会(WAIC)首次亮相。

RWKV(Receptance Weighted Key Value)是全球领先的 RNN 大模型架构,它成功结合了递归神经网络(RNN)的恒定复杂度和高效串行推理,以及 Transformer 的并行处理优势,使其在文本生成、时间序列、图像和视频、语音和音乐等领域表现出色,推理成本和训练成本显著低于 Transformer。这项技术的核心突破在于引入 RWKV 算子替代 Transformer 的位置编码和多头注意力机制。

在本次世界人工智能大会(WAIC)上,基于高通 QCS8550 平台的两大 RWKV 联合解决方案登场:RWKV Chat 是一款离线 AI 聊天应用,无需联网即可实现推理、深度对话与文本续写,支持个性化会话配置,成为用户的 " 口袋级 " 生产力伙伴。RWKV 数独则展示了 20M 超小参数模型在超长链式推理(CoT)下的数学解题能力。

移远通信的 SG885G 基于高通 QCS8550 平台开发,其 AI 综合算力高达 48 TOPS,能够支撑 7B 左右参数级的多模态模型在本地化推理。移远率先实现对 Llama、通义千问、DeepSeek 等主流开源模型的全方位兼容,兼容的参数范围覆盖 0.5B 至 8B。此外 SG885G 支持运行非 Transformer 路线的 RWKV7 架构,这一特征显著降低了对算力和内存的需求。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

高通 世界人工智能大会 数学 神经网络 通义千问
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论