派财经 02-21
被誉为“神秘东方力量”的DeepSeek如何搅动AI行业格局?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

出品|派财经原创(ID:paicj314)

文|小玖

今年以来 DeepSeek 横空出世震撼了投资圈和资本市场。

2 月 21 日,DeepSeek 在社交平台 X 发文称,构建了一支探索 AGI(通用人工智能)小团队,从下周起将开源 5 个代码库,以完全透明的方式分享研究进展。

前日,DeepSeek 刚刚否认了对外融资为不实消息,此前,曾有外媒报道称据 DeepSeek 首次考虑进行外部融资,以应对不断增长的算力需求。早在 2 月初,就有消息称阿里巴巴拟以 100 亿美元估值投资 DeepSeek,认购 10% 股权,但随后阿里副总裁颜乔在社交媒体平台辟谣称网传消息不实。

事实上,今年以来,已有多家头部企业、投资机构与 DeepSeek 取得接洽。不过,DeepSeek 背后有着强大的资金支持,并不缺钱。

DeepSeek 到底有多强?谁在 DeepSeek 中受益了?

DeepSeek 有多强?

今年春节期间,Deepseek 发布了开源模型 DeepSeek-R1,以强大的推理能力和极高性价比快速横扫全球,一经发布引发业内外广泛关注。

在 DeepSeek 之前,令全球 AI 行业为之震撼的还是由 Open AI 开发的 ChatGPT。从 2024 年 9 月 OpenAI 发布 o1-preview 到现在,在市场上掀起了大规模追赶,可以与之性能相媲美甚至在其之上的推理模型层出不穷。

而 DeepSeek 之所以能杀出重围,主要原因在于其不仅率先达到了 Open AI - o1 模型的效果,更是将推理模型的成本压缩到了极低。

具体来说,DeepSeek-R1 的技术突破在于,用纯深度学习的方法让 AI 自发涌现出推理能力。据 DeepSeek 官网介绍,DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有很少标注数据的情况下极大提升了模型的推理能力,在数学、代码、自然语言推理等任务上,测评性能与美国开放人工智能研究中心(OpenAI)开发的 GPT-o1 模型正式版接近,o1 模型首次实现真正的通用推理能力,能在 " 博士级别 " 的科学问答环节上超越人类专家。

DeepSeek R1 有多强?有测试者以常用的碰撞检测来验证,要求大模型编写一个程序,使得一颗小球在某个缓慢旋转的几何形状内弹跳,并保持小球停留在形状内,碰撞检测对于模型的推理能力考验巨大,稍有不慎便会导致出现肉眼可见的物流错误。而测试结果表面,R1 的表现要明显优于 OpenAI o1pro 模式。

除了性能强大外,R1 的另一大优势在于超高性价比。据了解,DeepSeek-R1 模型训练成本仅为 560 万美元,这一数值要远低于美国一众科技巨头公司在人工智能技术上高达数亿甚至数十亿美元的投入,比如 ChatGPT-4 的训练成本就高达超 1 亿美元。另据技术报告显示,R1 面向开发者的服务定价为每百万 token(输入字符串)1 — 4 元,仅为 o1 的 1/30 左右。

DeepSeek 创始人梁文峰曾在媒体采访时表示,无论是 API 还是 AI 都应该是普惠的、人人可以用得起的东西。

值得一提是,DeepSeek 采用了完全开源策略,一方面降低了用户的使用门槛,另一方面开源之后的 DeepSeek 吸引了不少开发者和研究人员的关注,进一步促进了 AI 开发者社区的协作生态繁荣,推动了 AI 技术的发展。

此前 OpenAI 也曾表达了希望以最有可能造福全人类的方式推进数字智能发展,而不受产生财务回报需求的限制。但 OpenAI 的开源策略只坚持到了 GPT-3 发布之前,GPT-4 发布之后更是隐藏了其训练数据和模型权重,逐步走向闭合。

英伟达高级研究科学家 JimFan 在其个人社交平台表示," 我们正身处这样一个历史时刻:一家非美国公司正在延续 OpenAI 最初使命——通过真正开放的前沿研究赋能全人类。

DeepSeek 这股 " 神秘的东方力量 ",让二级市场开始对美国科技行业的竞争力产生质疑,受此冲击,美国芯片巨头英伟达股价暴跌 17%。

DeepSeek 的母公司深度求索成立于 2023 年 7 月 17 日,由著名量化私募幻方基金支持,资金实力雄厚,这也为其不以盈利为目的持续深挖技术提供了坚实支持。

早在 2024 年 5 月 7 日,深度求索发布的 DeepSeek-V2,也采用了开源模式,一经发布成为开源模型中中文综合能力(AlignBench)最强的代表,并在测评中与 GPT-4-Turbo,文心 4.0 等闭源模型被列入同一梯队;英文综合能力(MT-Bench)与最强的开源模型 LLaMA3-70B 处于同一梯队,超过最强 MoE 开源模型 Mixtral8x22B;知识、数学、推理、编程等榜单结果位居前列。

另外,其 API 价格只有 GPT-4o 的 2.7%,进一步激化了国内大模型价格战,在此后一周,字节、阿里、百度、腾讯先后宣布降价。

2024 年底,DeepSeek-V3 发布,在知识类任务、长文本理解、编程和数学运算等领域,其性能接近甚至超越了国际顶尖的闭源模型如 GPT-4o 和 Claude-3.5-Sonnet。

DeepSeek 的入局直接在全球 AI 领域掀起了一股连锁反应,放眼全球市场,微软、英伟达、亚马逊等云计算平台纷纷接入 DeepSeek,更是变相刺激 OpenAI 上线了 OpenAI o3-mini 系列模型,面向用户首次开放了推理模型的使用权限。

谁接入了 DeepSeek?

DeepSeek 浪潮下,据不完全统计,当前已有超过 200 家企业宣布接入 DeepSeek,覆盖基础电信企业、云计算、芯片、金融、汽车、手机等多领域。其中,包括华为、阿里、百度、腾讯、京东等在内的多家云平台宣布接入 DeepSeek 大模型,约 20 家车企宣布在智舱场景或 AI 运营领域完成与 DeepSeek 的深度融合。此外,多家券商、银行、公募基金也表示已接入 DeepSeek 大模型。

事实上,国内大厂此前已经在自研 AI 大模型战略上均有所布局,自家主力 APP 接入第三方大模型服务,可以看做是国内大厂的一次战略转变,也是对企业未来的押注。

腾讯在最近一次灰度测试中上线了基于 DeepSeek-R1 的 "AI 搜索 " 功能,被看做是其积极拥抱 AI 的策略,紧接着又在腾讯地图、 QQ 音乐、腾讯文档等产品均快速接入了 DeepSeek。

紧接着百度搜索也跟进了 DeepSeek,在宣布接入 DeepSeek 前,百度已经改变了大模型发展路线,先是宣布全部免费使用,接着改变闭源策略,开始拥抱开源路线,称将推出文心大模型 4.5 系列,走向开源。

当前几家互联网大厂中,字节对于拥抱接入 DeepSeek 的态度较为谨慎,当前在业务侧只有飞书官宣上线了 DeepSeek 系列模型,但入口也比较隐藏。

值得肯定的是,DeepSeek 的开源生态极大加速了 AI 场景落地进程,推动 AI 行业从硬件设施向软件应用层的进一步转变。大厂云服务率先接入了 DeepSeek,就是源于 DeepSeek 带来的空前热度和极低成本优势,有望成为打破市场价格战的突破口,进一步巩固现有市场地位。

DeepSeek 有多强?随着 DeepSeek 的爆火,大批流量涌入,伴随着一些黑客攻击,DeepSeek 官网时不时会卡顿。

相较于市面上其他大模型语言产品,DeepSeek 在用户端的区别是,展现了详尽的思考过程。

如何使用好 AI 大模型,让其成为有效提升工作效率的工具,也是一门学问。细心网友已经总结出了一套规律,成为 AI 们的领导,就会和真的领导一样面临着一些用人的困境。

一个聪明但是不干活的 deepseek,一个愚蠢但是很勤劳的豆包,一个中等但是不给你情绪价值的 kimi 和一个海外留学我请不起的 chatGPT。

亦有网友细心总结称,需要利用一些管理才能。先用聪明的 deepseek 制定策略(只能回答 1 次,需珍惜机会),再用勤劳的豆包填充内容(能输出无数次,无限使用),kimi 可以用于赛马,把 kimi 和豆包的方案对比取优,涉及海外的信息可以再用 chatGPT 查一遍。

但值得注意的是,这些 AI 都会欺骗你,如果你不认真分辨分分钟被忽悠。

落地到应用层面

DeepSeek 的暴利与隐忧

随着 DeepSeek 的爆火,已经有一拨人赚到了钱。

在社交媒体平台上分享普通人如何通过 DeepSeek 搞副业、做自媒体创业收取学费,常用话术是 " 低门槛创业 "" 爆款易出 " 以及 "2025 年最大的变现风口等。

有博主表示,相关社区在 4 天吸引了 4000 人付费加入,收入近 20 万元。

小红书上话题 #deepseek 的浏览量达 8.2 亿次,讨论量 526.3 万;在抖音,话题 #deepseek 的播放量达到 114.6 亿次。

有义乌老板娘用 DeepSeek+Al 做跨国生意,只需要对着镜头说 "12345",就能生成几十种语言视频。

有网友跟着 DeepSeek 买彩票中奖、也有人试图通过其算出接下来一年的运势。

小红书用户 @Yapie 程序员哥用 deepseek 创作歌曲《七天爱人》在网易云爆火,自 2 月 11 日 -17 日 0 时,该歌曲的有效播放量为 18.6 万,收藏量达 9555,评论量为 1769。而这首歌曲也为他带来了日均 150 元的收益。

值得一提的是,跟随 DeepSeek 爆火,一些风险和挑战已经显现出来。

一方面来自数据泄露风险,网络攻击可能会导致 DeepSeek 的用户数据、技术数据等被窃取。一旦数据泄露,不仅会损害用户的利益,还会使 DeepSeek 面临法律责任和声誉损失,甚至可能被竞争对手利用来获取商业利益‌

另外来说,Deepseek 作为一家初创 AI 小公司,公司内部人才面临国内阿里百度腾讯等大厂和美国硅谷大厂挖角的风险;

此外,还有一些来自美国政府的压力,美国以 " 国家安全 " 为由对 DeepSeek 展开调查,背后是其试图维护自身在 AI 领域的霸权地位。未来可能会出台更多针对 DeepSeek 的政策限制,甚至可能会联合其他国家对其进行联合打压,限制其在全球市场的发展‌。

最重要的是,AI 大模型在蓬勃发展至今,仍未看到大规模商业化落地的前景,在价格战内卷之下,如何收回上亿研发成本都需持续观望。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

融资 人工智能 开源 美国 社交平台
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论