钛媒体 App 1 月 27 日消息,国产 GPU 厂商曦望(Sunrise)发布新一代推理 GPU 芯片启望 S3。这是曦望在近一年累计完成约 30 亿元战略融资后的首次集中公开亮相。2025 年,曦望芯片交付量已突破万片。启望 S3 为面向大模型推理的定制化 GPGPU 芯片。据了解,其在典型推理场景下的整体性价比较上一代提升超 10 倍。算力与存储设计上,该芯片支持 FP16 至 FP4 精度切换,采用 LPDDR6 显存方案,显存容量提升 4 倍。在 DeepSeek V3/R1 满血版等主流大模型推理中,单位 Token 成本较上一代降低约 90%。(界面)


登录后才可以发布评论哦
打开小程序可以发布评论哦