直面AI 02-26
DeepSeek头号黑粉这下爽到了
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

还真让 DeepSeek 头号黑粉美到了。

北京时间 2 月 25 日,Anthropic 传来两个好消息。

第一个好消息是,Anthropic 发布首个 " 混合模型 "Claude 3.7 Sonnet。在腾讯、阿里、xAI 等纷纷跟上 DeepSeek 的脚步,推出推理模型的时候,Anthropic 说 " 我都要 ",将及时应答和深度思考结合,抛弃了多模型堆砌的做法。

第二个好消息是,在 Claude 3.7 Sonnet 发布的几乎同时,《华尔街 . 日报》称 Anthropic 接近完成 35 亿美元的新一轮融资,估值可能达到 615 亿美元,是此前 180 亿美元估值的 3 倍有余。

Anthropic 有很多头衔。这家公司是 OpenAI" 叛军 " 代表,是硅谷明星人工智能初创公司。同时,在近一个月,该公司还成为了 "DeepSeek 头号黑粉 ",不仅质疑 V3 的 600 万美元训练成本,还由联合创始人之一亲自上阵撰写檄文,呼吁加强美国的芯片出口管制。

如今新模型发布,再加上融资即将超额完成的消息,Anthropic 暂时顶住了 DeepSeek 带来的压力。

这不仅是属于 Anthropic 的好消息,实际上,在华尔街和大众都因 DeepSeek 质疑硅谷的高支出 AI 战略时,Anthropic 的表现证明着神话还未破灭。对 OpenAI 等也在融资的企业来说,也无疑是一个积极的信号。

DeepSeek R1 推理模型的推动下,OpenAI 火速上线 o3 mini,马斯克的 xAI 也在上周发布 Grok 3 时带上了 Grok Reasoning。

而 Anthropic 此时选择:来个混合大招。

此前一直传闻 Claude 4 即将发布,但 Anthropic 这次实际上发布的是 Claude 3.7 Sonnet。

Anthropic 称,Claude 3.7 Sonnet 是市面上首款 " 混合模型 ",并将立即投入使用。

此 " 混合 ",指的是业界首个在单一架构上整合实时应答和深度思考的模型。相比而言,不管是 DeepSeek 的 R1 模型,还是 OpenAI 的 o3-mini,都是严格的推理模型。

在使用 R1 和 o3-mini 时,思考过程是强制的,用户只能等待,由此拖慢获取答案的时长。但有的问题实际上并不需要长时间地思考,这时候需要用户来判断并切换到及时应答的模型。

但在 Claude 3.7 Sonnet 这种混合模型中,用户不必切换即可获取实时应答或者深度思考。

" 这个模型融合了所有功能——我们的目标是拥有一个统一的 AI,能适用于各种场景。这样对我们的客户而言会更简单一些。"Anthropic 联合创始人兼首席科学家贾雷德 · 卡普兰表示。

卡普兰将其比作人类大脑的运行方式:有的问题需要深度思考,有的问题需要快速作答。Claude 3.7 Sonnet 将这两种能力整合在同一个模型中,而不是完全分开。

除此之外,用户可以利用 " 草稿 " 功能,在问题比较复杂时,指导模型进行更准确的思考;API 用户还可以精细控制 Claude 3.7 Sonnet 的思考时长,甚至控制思考的预算,如告诉 Claude 在回答时最多思考多少个 tokens。

在模型表现上,相较于上一代 Claude 3.5 Sonnet:"Claude 3.7 Sonnet 在遵循指令、一般推理、多模态能力和自主编码方面表现出色,扩展思维在数学和科学方面提供了显著提升。" 值得一提的是,其数学、编码能力提高 10%。其中编码能力尤为突出,在多个测试中有所展现。

根据 SWE Bench 测试数据,Claude 3.7 的代码能力大幅超越 DeepSeek R1、OpenAI 的 o1、o3 模型。专注 AI 编程的 Cursor 已经宣布集成 Claude 3.7 Sonnet。

Claude 3.7 Sonnet 已经全面上线,支持免费版、专业版、团队版和企业版,此外可以在 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 上使用。不过免费用户目前无法使用扩展思考模式。

在定价方面,Claude Sonnet 3.7 的价格为:输入 3 美元 / 百万 tokens,输出 15 美元 / 百万 tokens。这与前代模型保持一致,并显著高于竞争对手的纯推理模型,如 OpenAI o3 mini 和 DeepSeek R1。

在此基础之上,Anthropic 也同步发布了专注于代码的 Agent Claude Code,可以直接在终端运行,帮开发者完成编程任务。

从搜索、阅读代码、编辑文件、编写代码、运行测试,一直到将代码提交到 GitHub。不过,目前 Claude Code 仅作为有限的研究预览版提供。

在发布大模型的同时,Anthropic 正在进行的融资也传来好消息:

《华尔街 . 日报》报道:"Claude 背后的公司克服了因中国 DeepSeek 的成功引发的投资者担忧,估值达到 615 亿美元。"

据称,Anthropic 即将完成一轮 35 亿美元的融资,估值将达到 615 亿美元。最新一轮融资的投资者包括风投公司 Lightspeed Venture Partners、General Catalyst 和 Bessemer Venture Partners。总部位于阿布扎比的投资公司 MGX 也在洽谈参与事宜。

这个数字虽然离 OpenAI 的 1570 亿美元估值还有距离,但是超过了 xAI 去年底的 400 亿美元估值。xAI 也正在寻求融资,预计估值 750 亿美元。

要知道,这次融资之前 Anthropic 的估值还只有 180 亿美元。

知情人士向《华尔街 . 日报》透露,Anthropic 最初计划筹集 20 亿美元,但在和投资者谈判期间成功提高了这一数额。

Anthropic 迎头赶上,甚至拿出 " 要超越你们所有人 " 的架势,这并不令人意外。可以说,今天的两个好消息,都在夯实 Anthropic 被贴在身上的标签。

Anthropic 自 2021 年成立之初,就因其由 OpenAI 前员工创办,而喜提 "OpenAI 叛军 " 的称号。

之前 Anthropic 已经多次抢先 OpenAI 一步。如去年的 " 代理 " 功能,OpenAI 在 Anthropic 之后跟进。

这次发布混合模型,高举 " 反多模型堆砌方案 " 的大旗,也不禁让人想到了 OpenAI CEO 山姆 · 奥特曼前不久发布的 GPT 5 计划。彼时奥特曼就表示,意识到模型和产品功能太复杂,未来将统一。不承想又被 Anthropic 抢先一步了。

Anthropic 的联合创始人卡普兰和迈克 · 克里格 都表示,预计竞争对手很快也会转向这种混合模型的方向。

另一方面,在 DeepSeek R1 横空出世之后,Anthropic 俨然化身 "DeepSeek 头号黑粉 "。

对 DeepSeek 的态度,硅谷大佬们大多是赞许中带着苦涩,但言语上还算客气。

如马斯克在 Grok 3 发布前,一边赞许 DeepSeek R1 很强,给中国工程师点赞,但也表示 DeepSeek 带来的不算 AI 领域的一次突破,并顺势夸赞了自家的模型。

奥特曼一边大赞 DeepSeek" 无疑是令人印象深刻的模型 ",一边暗戳戳地表示 DeepSeek 用 OpenAI 专有模型训练自己的模型,可能违反了其服务条款。后来又 " 大方 " 表示 " 没有起诉 DeepSeek 的计划 "。

而 Anthropic 就很不客气了,不仅压根不相信 DeepSeek V3 的训练成本仅有 600 万美元,甚至创始人之一的达里奥 · 阿莫迪还发布了檄文《关于 DeepSeek 和出口控制》。

文章的核心思想就是,由于 DeepSeek V3 不可能只花了 600 万美元成本,而咱们又听说他们走私了芯片,因此咱们得好好管制一下芯片出口。之前只管 H100 和 H800 这些高端芯片显然是不够的,咱得把 H20 也管起来。

Anthropic 当然不愿意认,虽叫 "OpenAI 叛军 ",但背靠巨头烧钱这方面,二者如出一辙。OpenAI 前有微软后有软银,而 Anthropic 则抱上了谷歌和亚马逊的大腿。

尤其是亚马逊,2023 年就向 Anthropic 投资了 40 亿美元,2024 年又承诺投资 40 亿美元。

而 DeepSeek 的大火又恰逢 Anthropic 进行新一轮融资之时,着急上火也是情理之中的。左手檄文打压 DeepSeek,右手发布及时应答 + 深度思考的混合模型,总算稳住了局面,如果不出意外,这一轮 Anthropic 将超额完成融资目标。

Anthropic 的两个好消息,也可以让硅谷暂时松口气了。

正在融资的不止有 Anthropic。

据《华尔街 . 日报》等媒体,OpenAI 正在洽谈巨额融资,拟融资额至多 400 亿美元,估值可能被推高至 3000 亿美元。此外,xAI 也在进行新一轮融资,以 750 亿美元估值寻求 100 亿美元融资。他们无疑也都感受到了 DeepSeek 带来的投资者担忧。

Anthropic 至少证明了,在当下硅谷搞投入的 AI 路径尚未神话破灭," 大力出奇迹 " 在某种程度上依然可以打动人心,虽然可能需要付出比之前多的游说成本。

但战争远没有结束。

一方面,Anthropic 依然面临着商业化难题,而这一点在后 DeepSeek 时代显得更加刺眼。Anthropic 此前估值和收入比达到 68.6 倍,而 OpenAI 大概在 42.4 倍的水平。

据 The Information,Anthropic 的收入预计将从 2025 年的 22 亿美元激增到 2027 年的 120 亿美元。挑战在于开支,今年 Anthropic 预计 " 烧钱 "30 亿美元,已经比前一年的 56 亿美元低了。公司高层表示,预计到 2027 年可以停止赤字开支,实现盈利。

另一方面,自身商业化难解的同时,外部竞争也在加剧。

Grok 3 刚刚发布,Anthropic 发布混合模型,紧接着谷歌的视频生成模型 Veo 2 API 也曾宣布在年初发布,还有 OpenAI 的 GPT-4.5 随时可能降生,以及 GPT-5 预计在 5 月底发布。

开源的战场也越来越热闹。马斯克的 xAI 延续新代发布、开源上一代模型的做法,宣布将开源 Grok 2。而 OpenAI ——此前和 Anthropic 一起被视为 " 闭源 " 的代表——也松了口,奥特曼面对 DeepSeek 的大火,直接坦言过去站在了 " 错误的一边 ",在社交媒体上发起投票,释放将有一个 " 开源项目 " 的信号。

而眼下,DeepSeek 也没有坐以待毙,而是宣布启动 " 开源周 ",目前已经开源 FlashMLA 的代码,以及 EP 通信库。

Anthropic 顶住了 DeepSeek 的压力,发布混合模型、传出超目标融资的消息。但要让好消息延续,仍有诸多挑战。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

腾讯 mini 融资 华尔街 美国
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论