被卡算力又如何,万亿模型只用 460 万,能硬刚 GPT 吗?

大家好我是老札，最近中美 AI 赛道的风向彻底变了，这边硅谷两大头部 AI 企业还在为客户预算、资本估值争得头破血流，另一边国内两大 AI 巨头已经悄悄换了玩法。

两大国产 AI 同时放出大招，抱团取暖比单干香多，近日 DeepSeek 发布 V4 万亿参数模型，性能直接对标 GPT，还实现了国产芯片适配。

几乎同一周，Kimi 也带来了全新的 K2.6 模型，同样是万亿参数、开源路线，两个国产头部玩家同时发力，直接给硅谷整不会了。

更有意思的细节藏在技术报告里：DeepSeek V4 训练时用上了 Kimi 团队此前验证优化的 MUN 优化器，而去年 Kimi 发布的 TDK2，也采用了 DeepSeek 的 MLA 架构。

太平洋两岸的差异一下子就出来了，在美国，大模型还是各家单打独斗，专利墙、授权费卡得死死的，但国内不一样，算力被卡脖子，大家根本没法各自为战，干脆抱团取暖。

开源代码随便用，论文成果随便借鉴，没有律师函，没有互相拆台，相当于互相交换大脑，一起变强。

算明白账！我们的成本是硅谷的十分之一

GPT-4 的训练成本高达 7800 万美元，而 DeepSeek V3 只花了 557.6 万美元，Kimi 的 K2.6 Thinking 甚至只用了 460 万。

这种差距一目了然：硅谷那边满脑子都是搞垄断、赚快钱，把昂贵的模型卖给有钱人；国内则是拼着把每一分算力、每一块钱都花在刀刃上，拼命压低训练和推理成本。

OpenAI 和 Anthropic 还在互相嘲讽内耗，OpenAI 高管吐槽对手把廉价算力吹成黑科技，Anthropic 反手就说 OpenAI 的安全承诺只是商业表演。

两队为了抢客户抢投资，天天互相撕，精力全耗在内斗上，我们这边却靠着抱团分工，用不到硅谷十分之一的资源，造出了能追平巨头的模型。

芯片突围！从被卡脖子到联手破局

DeepSeek V4 不光性能猛，还深度适配了华为国产芯片，顶级开源模型和头部国产芯片强强联手，直接打破了英伟达的重重包围。

Kimi 团队的最新论文也传来好消息：模型训练的不同阶段，可以适配不同类别的芯片，这等于给国产芯片大规模入局打开了大门，不用再被一家厂商的芯片卡住脖子。

很多人还在说国产 AI 不如硅谷，甚至觉得两家的估值加起来都不到对手十分之一，但要知道，现在底层模型的比拼早就不是赚不赚钱的事了，能不能掌握核心技术、不被卡脖子，才是硬气的底气。

就像当年的原子弹，不是为了主动攻击，而是当别人想封锁打压我们的时候，手里有硬家伙，腰杆能挺得直。

这就是现在中国 AI 的底气，不靠单打独斗抢快钱，靠着生态抱团、精打细算，一步步破局突围。

我们不追求一时的估值神话，只追求真正的技术自主，这才是能走得远的路子。

宙世代