(全球 TMT2025 年 7 月 28 日讯)7 月 27 日,移远通信宣布与 RWKV 公司建立全面合作关系,双方将依托移远的算力平台,优化并支持 RWKV 最新模型架构,共同推动大模型在端侧设备的低资源占用部署。此次合作成果于 2025 世界人工智能大会(WAIC)首次亮相。
RWKV(Receptance Weighted Key Value)是全球领先的 RNN 大模型架构,它成功结合了递归神经网络(RNN)的恒定复杂度和高效串行推理,以及 Transformer 的并行处理优势,使其在文本生成、时间序列、图像和视频、语音和音乐等领域表现出色,推理成本和训练成本显著低于 Transformer。这项技术的核心突破在于引入 RWKV 算子替代 Transformer 的位置编码和多头注意力机制。
在本次世界人工智能大会(WAIC)上,基于高通 QCS8550 平台的两大 RWKV 联合解决方案登场:RWKV Chat 是一款离线 AI 聊天应用,无需联网即可实现推理、深度对话与文本续写,支持个性化会话配置,成为用户的 " 口袋级 " 生产力伙伴。RWKV 数独则展示了 20M 超小参数模型在超长链式推理(CoT)下的数学解题能力。
移远通信的 SG885G 基于高通 QCS8550 平台开发,其 AI 综合算力高达 48 TOPS,能够支撑 7B 左右参数级的多模态模型在本地化推理。移远率先实现对 Llama、通义千问、DeepSeek 等主流开源模型的全方位兼容,兼容的参数范围覆盖 0.5B 至 8B。此外 SG885G 支持运行非 Transformer 路线的 RWKV7 架构,这一特征显著降低了对算力和内存的需求。
登录后才可以发布评论哦
打开小程序可以发布评论哦