“小龙虾”好玩但太费钱国产GPU厂商云天励飞放言：成本将降低100万倍

快科技 3 月 6 日消息，2026 年开年爆火的 AI 当属 OpenClaw，被称为小龙虾的它可以充当 7x24 小时 AI 打工人，玩法非常多，但消耗的 Token 太多了，很多人烧不起。

这也是最近 2 个月国产 AI 大模型调用超越了谷歌、OpenAI、Anthropic 的原因，他们的 Koken 费用比国外便宜多了，但还是不够便宜，要想解决这个问题还得需要大幅降低成本。

国产 GPU 初创企业云天励飞董事长兼 CEO 陈宁日前提出了一个新观点，表示未来 5 到 10 年全球 AI 竞争将从过去 10 年的谁最聪明转向最能让 AI 应用大规模落地。

目前 AI 应用落地的瓶颈就在成本，Token 费用是 OpenClaw 这样的智能体落地的关键难点，而他的目标就是用各种方式在未来 5 年在十五五期间将成本降低 100 万倍，2030 年百亿 Token 只要 1 分钱。

云天励飞具体怎么实现这个目标就没细节了，不过该公司今年初发布了新一代 GPU 路线图，将推出 GPNPU 芯片，名字有 GPU+NPU 的双重含义，可以兼容 CUDA，只需一行代码就完成 GPU 到国产芯片的部署迁移。

在具体的产品上，他们设计了 prefill 与 decode 分离的系统架构，P 芯片侧重计算密集，D 芯片侧重访存密集，以此实现极致的推理效率与极致性价比。

他们的 GPNPU 芯片也会有多个芯片协同的超节点，其中 26 年将推出第一代超节点 P 芯片，算力对标 NVIDAI 的 Hopper 架构芯片，27 年则会推出第一代超节点 D 芯片，主打超低时延推理，对标 NVIDAI 的 Blackwell 架构芯片。

28 年的第二代超节点 D 芯片则会对标 NVIDIA 的 Rubin 芯片，有望实现毫秒级推理时延。

宙世代