快科技 3 月 6 日消息,2026 年开年爆火的 AI 当属 OpenClaw,被称为小龙虾的它可以充当 7x24 小时 AI 打工人,玩法非常多,但消耗的 Token 太多了,很多人烧不起。
这也是最近 2 个月国产 AI 大模型调用超越了谷歌、OpenAI、Anthropic 的原因,他们的 Koken 费用比国外便宜多了,但还是不够便宜,要想解决这个问题还得需要大幅降低成本。
国产 GPU 初创企业云天励飞董事长兼 CEO 陈宁日前提出了一个新观点,表示未来 5 到 10 年全球 AI 竞争将从过去 10 年的谁最聪明转向最能让 AI 应用大规模落地。
目前 AI 应用落地的瓶颈就在成本,Token 费用是 OpenClaw 这样的智能体落地的关键难点,而他的目标就是用各种方式在未来 5 年在十五五期间将成本降低 100 万倍,2030 年百亿 Token 只要 1 分钱。
云天励飞具体怎么实现这个目标就没细节了,不过该公司今年初发布了新一代 GPU 路线图,将推出 GPNPU 芯片,名字有 GPU+NPU 的双重含义,可以兼容 CUDA,只需一行代码就完成 GPU 到国产芯片的部署迁移。
在具体的产品上,他们设计了 prefill 与 decode 分离的系统架构,P 芯片侧重计算密集,D 芯片侧重访存密集,以此实现极致的推理效率与极致性价比。
他们的 GPNPU 芯片也会有多个芯片协同的超节点,其中 26 年将推出第一代超节点 P 芯片,算力对标 NVIDAI 的 Hopper 架构芯片,27 年则会推出第一代超节点 D 芯片,主打超低时延推理,对标 NVIDAI 的 Blackwell 架构芯片。
28 年的第二代超节点 D 芯片则会对标 NVIDIA 的 Rubin 芯片,有望实现毫秒级推理时延。



登录后才可以发布评论哦
打开小程序可以发布评论哦