国际札 16小时前
被卡算力又如何,万亿模型只用 460 万,能硬刚 GPT 吗?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

大家好我是老札,最近中美 AI 赛道的风向彻底变了,这边硅谷两大头部 AI 企业还在为客户预算、资本估值争得头破血流,另一边国内两大 AI 巨头已经悄悄换了玩法。

两大国产 AI 同时放出大招,抱团取暖比单干香多,近日 DeepSeek 发布 V4 万亿参数模型,性能直接对标 GPT,还实现了国产芯片适配。

几乎同一周,Kimi 也带来了全新的 K2.6 模型,同样是万亿参数、开源路线,两个国产头部玩家同时发力,直接给硅谷整不会了。

更有意思的细节藏在技术报告里:DeepSeek V4 训练时用上了 Kimi 团队此前验证优化的 MUN 优化器,而去年 Kimi 发布的 TDK2,也采用了 DeepSeek 的 MLA 架构。

太平洋两岸的差异一下子就出来了,在美国,大模型还是各家单打独斗,专利墙、授权费卡得死死的,但国内不一样,算力被卡脖子,大家根本没法各自为战,干脆抱团取暖。

开源代码随便用,论文成果随便借鉴,没有律师函,没有互相拆台,相当于互相交换大脑,一起变强。

算明白账!我们的成本是硅谷的十分之一

GPT-4 的训练成本高达 7800 万美元,而 DeepSeek V3 只花了 557.6 万美元,Kimi 的 K2.6 Thinking 甚至只用了 460 万。

这种差距一目了然:硅谷那边满脑子都是搞垄断、赚快钱,把昂贵的模型卖给有钱人;国内则是拼着把每一分算力、每一块钱都花在刀刃上,拼命压低训练和推理成本。

OpenAI 和 Anthropic 还在互相嘲讽内耗,OpenAI 高管吐槽对手把廉价算力吹成黑科技,Anthropic 反手就说 OpenAI 的安全承诺只是商业表演。

两队为了抢客户抢投资,天天互相撕,精力全耗在内斗上,我们这边却靠着抱团分工,用不到硅谷十分之一的资源,造出了能追平巨头的模型。

芯片突围!从被卡脖子到联手破局

DeepSeek V4 不光性能猛,还深度适配了华为国产芯片,顶级开源模型和头部国产芯片强强联手,直接打破了英伟达的重重包围。

Kimi 团队的最新论文也传来好消息:模型训练的不同阶段,可以适配不同类别的芯片,这等于给国产芯片大规模入局打开了大门,不用再被一家厂商的芯片卡住脖子。

很多人还在说国产 AI 不如硅谷,甚至觉得两家的估值加起来都不到对手十分之一,但要知道,现在底层模型的比拼早就不是赚不赚钱的事了,能不能掌握核心技术、不被卡脖子,才是硬气的底气

就像当年的原子弹,不是为了主动攻击,而是当别人想封锁打压我们的时候,手里有硬家伙,腰杆能挺得直。

这就是现在中国 AI 的底气,不靠单打独斗抢快钱,靠着生态抱团、精打细算,一步步破局突围。

我们不追求一时的估值神话,只追求真正的技术自主,这才是能走得远的路子。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

芯片 kimi 开源 ai 美国
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论