(全球 TMT2025 年 7 月 30 日讯)近日,北京积算科技有限公司宣布其算力服务平台上线赤兔推理引擎。积算科技 PowerFul-AI 应用开发平台与赤兔合作,打造高性价比的模型轻量化部署方案。用户通过远程算力平台预置的模型镜像与 AI 工具,仅需 50% 的 GPU 算力即可解锁大模型推理、企业知识库搭建、智能体开发。
赤兔推理引擎由北京清程极智科技有限公司开发,并联合清华大学团队发布开源版本。其核心价值在于,打破了 FP8 模型原生部署时 GPU 必须支持 FP8 精度的要求。积算科技联合清程极智,完成了赤兔推理引擎在积算科技 PowerFul-AI 应用开发平台上的验证测试。赤兔推理引擎在积算科技 PowerFul-AI 平台上满足双方兼容性认证的各项标准,能够快速完成 DeepSeek、Qwen 等大模型推理部署,并支持基于非 FP8 精度 GPU 卡实现 FP8 模型部署,相比于使用 BF16 精度部署,GPU 算力需求减半。积算科技 PowerFul-AI 平台携手赤兔推理引擎,将为 AI 大模型应用开发打造 " 成本减半、零性能损耗 " 的解决方案。
登录后才可以发布评论哦
打开小程序可以发布评论哦