全球TMT 07-30
积算科技上线赤兔推理引擎,实现GPU算力需求减半
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

(全球 TMT2025 年 7 月 30 日讯)近日,北京积算科技有限公司宣布其算力服务平台上线赤兔推理引擎。积算科技 PowerFul-AI 应用开发平台与赤兔合作,打造高性价比的模型轻量化部署方案。用户通过远程算力平台预置的模型镜像与 AI 工具,仅需 50% 的 GPU 算力即可解锁大模型推理、企业知识库搭建、智能体开发。

赤兔推理引擎由北京清程极智科技有限公司开发,并联合清华大学团队发布开源版本。其核心价值在于,打破了 FP8 模型原生部署时 GPU 必须支持 FP8 精度的要求。积算科技联合清程极智,完成了赤兔推理引擎在积算科技 PowerFul-AI 应用开发平台上的验证测试。赤兔推理引擎在积算科技 PowerFul-AI 平台上满足双方兼容性认证的各项标准,能够快速完成 DeepSeek、Qwen 等大模型推理部署,并支持基于非 FP8 精度 GPU 卡实现 FP8 模型部署,相比于使用 BF16 精度部署,GPU 算力需求减半。积算科技 PowerFul-AI 平台携手赤兔推理引擎,将为 AI 大模型应用开发打造 " 成本减半、零性能损耗 " 的解决方案。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 于非 gpu 北京 开源
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论