自从进入 2025 年,中美两国的网络平台上都在被同一个词刷屏:DeepSeek。
在中国的各大主流平台上,DeepSeek 基本霸占了所有的热搜榜前三," 今天你 DeepSeek 了吗 " 正在成为简中网民的最新一代 " 接头暗号 "。而更离谱的是:这居然还比不上它在太平洋另一边的热度。
▲ DeepSeek(图:网络)
无数事实表明:美国在世界范围内大模型垄断的地位,因为 DeepSeek 的横空出世,正面临着前所未有的动摇。有人狂吹 DeepSeek 作为新兴语言模型的 " 彩虹屁 ";有人担忧中国技术升级将导致 AI 产业美股出现暴跌;还有人声称这是 " 中国黑客对新兴企业发起的攻击 "...... 甚至美国总统特朗普都发出严正警告,认为 DeepSeek 的崛起 " 应当为美国敲响警钟 "" 美国企业需要专注于竞争以赢得胜利 "。
DeepSeek 真的已经厉害到能让美帝都抖三抖的程度了吗?
01
首先,可以肯定的是:DeepSeek 的功能很强大,但仅靠一个 " 功能强大 " 还并不足以让它在短时间内就在市面上诸多 AI 模型的包围圈中脱颖而出,更别提让美国这样的巨无霸产生危机感。
▲美国产 AI 模型的代表 ChatGPT(图:网络)
其实,如果单从用户的视角出发,DeepSeek 在使用体验上无论和目前最知名的 AI 系统 ChatGPT 还是国内赛道上的文心一言、豆包等等相比,都并不具备明显优势,甚至在某些领域还处于下风。
比如最简单的例子,文心一言现在已经可以根据用户的描述来进行作画,而 DeepSeek 目前暂时还只能输出文案。
而在玩 " 笔杆子 " 这方面,DeepSeek 也没法保证持续拿出让人信服的表现。例如,给 DeepSeek 和字节跳动旗下的大模型 " 豆包 " 出这么一道题目:" 以《沁园春》为词牌,《登山》为题目写一首词 ",二者分别交上了这样的答卷:
豆包:乙巳新阳,风暖烟轻,策杖向山。望层峦耸翠,千岩竞秀;云岚缭绕,百瀑飞湍。曲径通幽,繁花照眼,鸟啭清歌引客前。抬眸处,见高峰峻极,直插霄汉。奋身拾级登攀,纵汗雨、淋漓意未残。感松涛阵阵,助威鼓劲;泉声汩汩,洗垢清烦。渐至巅崖,纵观云海,胸臆舒张天地宽。凭栏久,叹山川壮丽,醉了流年。
DeepSeek:叠嶂西驰,万马回旋,众山欲东。正惊湍直下,跳珠倒溅,小桥横截,缺月初弓。老合投闲,天教多事,检校长身十万松。吾庐小,在龙蛇影外,风雨声中。争先见面重重。看爽气朝来三四峰。似谢家子弟,衣冠磊落,相如庭户,车骑雍容。我觉其间,雄深雅健,如对文章太史公。新堤路,问偃湖何日,烟水蒙蒙。
▲ DeepSeek" 写 " 的《沁园春 · 登山》
如果以专业人士的眼光来评判,豆包的 " 作品 " 显然不大合格,不仅在平仄、格律等方面都有硬伤,还通篇弥漫着一种浓郁的 " 老干体 " 的气息。相比之下,DeepSeek 显然是表现更好的一方,语言流畅、词句清丽、气势雄浑,看起来,即使放在最顶级的诗词选本里,也丝毫不见逊色于两宋名家。
然而尴尬的是:只要百度一下,就会发现 DeepSeek 的这首《沁园春 · 登山》压根就是 " 复制粘贴 " 过来的,全盘照抄了辛弃疾的《沁园春 · 灵山齐庵赋时筑偃湖未成》。
所以很明显,DeepSeek ——即使是目前目前最新版本的 DeepSeek-V3 ——虽说在各方面参数基本上达到了 GPT-4o 和 Claude-3.5 等的水准,但并没有太多突破性的创造。要说 DeepSeek 比之最尖端的 AI 有什么优势,也就是它相对更符合中国互联网用户的语言习惯,因而在国内获得了更高的热度而已。
02
当然,虽然在功能性上还存在着诸多不尽如人意的地方,但 DeepSeek 能几乎一己之力就让象征着高水平人类精华的硅谷和华尔街集体破防,自有其过人之处。
最重要的一点就是:DeepSeek 能被做出来,这本身就是一个奇迹。
▲美国硅谷(图:网络)
DeepSeek 的亲爹,是一家名为 " 幻方量化 " 的金融公司。幻方量化开发 DeepSeek 的全过程大体可以概括为:在做 AI 量化交易时先囤积足够的 AI 大模型的 " 入场券 ",之后靠着一群基本由国内教育培养的 " 土产 " 应届博士生硕士生,花了 557 万美元和 2048 块性能不全的 " 太监版 " 英伟达 H800 GPU,开发出了 DeepSeek 这个敢跟世界顶尖大厂 AI 模型叫板的产品。
一组数据可以证实 DeepSeek 近乎玄幻的 " 花小钱办大事 ":Llama 3.1 的成本是 DeepSeek 的整整 10 倍,GPT-4o 更是达到 DeepSeek 成本的近 20 倍,而且这些一线 AI 模型使用的还都是受到美国严格控制、中国根本买不到的完整芯片。就是在这种几近 " 家徒四壁 " 的软硬件的限制下,DeepSeek 团队硬是在算法和框架上实现了多种优化和创新,堪称教科书一般的四两拨千斤。
军迷圈子里有一句调侃叫 " 穷则战术穿插,达则给老子炸 ",相当形象地概括出了很多前沿企业在产品开发上的 " 画风 ":就是通过烧钱的方式来 " 一力降十会 "。对比这种思路,DeepSeek 把成本控制几乎做到了极致,目前最昂贵的 DeepSeek R1 每百万输入 token 仅需 0.55 美元,输出则是 2.19 美元。再看 ChatGPT 的东家 OpenAI 的同类收费:输入 15 美元,输出 60 美元,差了近 30 倍。就算是号称零元购鼻祖的美国人,在这样的差距面前也得直呼内行。
▲ DeepSeek 创始人梁文锋(图:网络)
在中国人的眼里,或许会觉得这一幕似曾相识。八十多年前,革命先辈们不正是靠着艰苦的 " 小米加步枪 " 顶住了资源的封锁和物质的贫瘠,打败了不可一世的强敌,硬生生在世界之林中站起来了么?
03
随着 DeepSeek 的热度越来越高,曾经贵为人工智能独角兽的美国,很明显也越来越坐不住了,他们已经在近日开始了对 DeepSeek 的大面积 " 清算 "。
首先发难的,就是开发了 ChatGPT 的美国人工智能研究公司 OpenAI。他们声称:DeepSeek 涉嫌违规 " 蒸馏 "。意思就是说 DeepSeek 盗用了 ChatGPT 的专有模型来训练自己的模型,虽然这种行为在业内屡见不鲜,但 OpenAI 的服务条款是明文禁止类似的操作的。因此,DeepSeek 在美国的形象很不好,被攻击是 " 小偷 ",已从美区的 App Store 中被下架,白宫甚至已经开始了其对美国国家安全是否存在影响的评估。
▲ OpenAl 总部(图:网络)
说实话,这消息刚爆出来的时候,我都觉得 OpenAI 是梁文锋在美国的嘴替,在用寓褒于贬、明贬暗褒的手法帮 DeepSeek 扩大影响力。
按常理说,美国人要是想黑 DeepSeek,就应该从实际角度入手说些能落在实处的,比如批判它功能没自己强大、反应没自己迅速、说话没自己风骚 ...... 但从头到尾,他们都没评价 DeepSeek 到底是个啥水平,只是上下嘴唇一碰来了个干巴巴的 " 违规蒸馏 ",还没有能实锤的证据。
那么,我们似乎可以这样理解:美国人也承认 DeepSeek 厉害,但它不能这么厉害,所以一定是开挂了,好气啊呜呜呜。
因为这里面存在非常重要的一个细节:ChatGPT 本身是闭源的,即它的源代码无法被开发者之外的任何人在未经授权的前提下查看。而 OpenAI 却又说 DeepSeek 盗取了他们的模型来 " 蒸馏 ",那么如果这事属实的话,只有两种解释——要么你 OpenAI 的安全系统形同虚设,谁都能进去吐口痰;要么就是你 OpenAI 的安全系统很强,但架不住 DeepSeek 更强,能无视隐私防护在你的数据库里七进七出。
第一种情况证明我军太无能,第二种情况证明敌人太狡猾,自己选一个吧。
所以你看,美国这一波是不有点儿 " 我看你不顺眼但又干不掉你 " 的无能狂怒的既视感了?
04
DeepSeek 火爆的意义是多方面的,绝不仅限于表面上的 " 中国在人工智能上已经接近了世界先进水平 " ——这当然很重要,但还不是最重要。
一直以来,AI 大模型的发展方向,实际上都是 " 军备竞赛 ",只管这个系统本身的 " 算力 ",只要算法够强,我不在乎花了多少人力物力,本质上就是看谁的钱多。
而 DeepSeek 的进场,对于砸钱已成常态的 AI 界无疑是一波巨大的地震。因为中国人以实际成果证实:AI 在软件这一层面的算法仍然具备相当大的可操作空间。不需要靠简单粗暴的 " 大力出奇迹 ",也能搞出来世界最顶尖的 AI。
更令人兴奋的是:相比于前面提到的闭源的 ChatGPT 这些模型,DeepSeek 反其道而行之,直接提供了开源。这样一来,无论是受美国制裁限制的中国企业,还是那些承担不起高昂硬件成本的外国企业,都可以通过 DeepSeek 实现 " 没吃过猪肉但可以看一看猪跑 ",从而得到入局 AI 领域的启发。相当于一己之力帮很多人解决了 " 钱 " 这个最老大难的问题,突破了 AI 产业链的瓶颈。
从原子弹到氢弹,从超级计算机到射电望远镜,从量子卫星到空间站,从航母到六代机,再到如今的 DeepSeek,中国的技术始终在不断突破,不仅不再怕被 " 卡脖子 ",甚至已经开始让大洋彼岸开始担心 " 被卡脖子 "。
某种角度上来说,这或许也是一种 " 屠龙少年终成恶龙 " 吧?
来源 / 今西安
登录后才可以发布评论哦
打开小程序可以发布评论哦