科创板日报 8小时前
英伟达收编潜在颠覆者 AI推理芯片公司Groq什么来头?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

《科创板日报》12 月 25 日讯(编辑 宋子乔) 当地时间周三(12 月 24 日),被视作英伟达 " 挑战者 " 的 Groq 在官网宣布,与英伟达达成一项 " 非独家授权协议 "。Groq 创始人兼 CEO Jonathan Ross、总裁 Sunny Madra 等核心高管及团队将加入英伟达。

这不是一次对公司整体的收购。英伟达支付约 200 亿美元现金,获得了 Groq 的核心 AI 推理技术知识产权和相关资产,而 Groq 的云服务业务(Groq Cloud)将继续独立运营。

这被认为是科技巨头争夺顶级 AI 人才与技术的典型方式,能以绕过复杂反垄断审查的形式,快速获取关键创新。对于 Groq 而言,这可能意味着其独立的硬件挑战者征程告一段落,但其核心技术将在英伟达的生态中获得更广阔的开发平台。

Groq 是专攻 AI 推理芯片的明星初创公司,成立于 2016 年,总部位于美国加利福尼亚,创始人 Jonathan Ross 曾是谷歌自研 AI 芯片 TPU(张量处理单元)项目的核心研发成员,部分谷歌前 TPU 团队成员也跟随他加入了 Groq。

Jonathan Ross 作为谷歌第一代张量处理单元(TPU)项目的核心研发人员,深度参与了专为 AI 优化的芯片设计。这个项目后来被用于击败围棋冠军李世石的 AlphaGo 比赛,也是 Google AI 服务的关键硬件。2016 年,他带领谷歌 TPU 团队 10 名核心成员中的 7 位一同离职,创立了 Groq。当时他发现,传统计算架构(如 CPU/GPU)无法高效处理现代 AI 任务,这一认知促使他决定创办一家突破传统限制的公司。

Jonathan Ross

Groq 的核心产品是LPU(语言处理单元),这类芯片主要用于加快大语言模型完成推理相关任务的速度,被外界视为英伟达 GPU 替代方案之一。

2024 年 2 月,Groq 推出了一款全新的 AI 芯片,声称实现了 " 地表最强推理 " ——在 Groq 上运行大模型的推理速度较英伟达 GPU 提高 10 倍甚至更高。

2025 年 11 月,美国白宫和美国能源部的最新声明显示,24 家顶尖的人工智能企业已与美国政府签署协议,加入 " 创世纪计划 ",英伟达和 Groq 都位列其中。

目前,Groq 已与 Meta 合作为其 Llama API 提供推理加速;与 IBM 合作整合其 AI 推理平台;与沙特阿美签署巨额协议,计划建设大型 AI 推理数据中心。

Groq LPU:推理速度惊人但成本高昂

惊人的推理速度、差异化的技术路线被视作 Groq LPU 安身立命的根本。在 Llama、Mixtral 等大模型上,其文本生成速度(每秒可达 500 个 token)曾引发广泛关注,被认为远超同期 GPU。

另外, Groq LPU 的工作原理与英伟达的 GPU 不同,它采用了名为时序指令集计算机(Temporal Instruction Set Computer)架构,使用存储器为静态随机存取存储器(SRAM),其速度比 GPU 所用的高带宽存储器(HBM)快约 20 倍。

从芯片的规格中,SRAM 容量是 230MB,带宽 80TB/s,FP16 的算力是 188TFLOPs。这一区别造成了 LPU 和 GPU 在生成速度的差别。据 Groq 表示,英伟达 GPU 生成每个 tokens 需要约 10 焦耳(J)到 30 焦耳,而 Groq 仅需 1 焦耳到 3 焦耳。

但 Groq LPU 并不是完美的,其面临成本与通用性面临挑战,为运行大模型所需的庞大集群带来了高昂的购置和运维成本,且专用芯片难以灵活适应快速迭代的 AI 算法。

前阿里巴巴集团副总裁、Lepton AI 创始人兼 CEO 贾扬清曾在社交平台上表示,由于每一张 Groq 卡的内存容量仅为 230MB,因此在运行 Llama-2 70B 模型时,需要 305-572 张 Groq 卡才足够,而用 H100 则只需要 8 张卡。

贾扬清认为,如果按未来运行三年的成本算,Groq 的硬件采购成本是 1144 万美元,运营成本至少要 76.2 万美元。从目前的价格来看,这意味着在同等吞吐量下,这几乎是 H100 硬件成本的 40 倍、能耗成本的 10 倍。

不止是成本高昂。SRAM 技术面积大、功耗比较高,早就以 IP 内核形式集成到 SoC(系统级芯片)里面,并非单独用,远不如 HBM 的未来发展潜力。业内人士表示,综合来看,不管是比单位容量价格、还是性能和功耗,英伟达 GPU 所使用的 HBM 技术都优于 SRAM。

估值飙升至 69 亿美元 去年营收 9000 万美元

目前,Groq 已完成多轮融资,最新估值约69 亿美元

2017 年:种子轮 1030 万美元。

2021 年:C 轮融资 3 亿美元,估值超过 10 亿美元,成为独角兽。

2024 年 8 月:完成由贝莱德(BlackRock)领投的 6.4 亿美元 D 轮融资,估值达到 28 亿美元。

2025 年 9 月:完成新一轮 7.5 亿美元战略融资,估值跃升至约 69 亿美元。

Groq 背后既有顶级的跨国金融机构,也有领先的科技产业巨头,还有活跃的风险投资基金:

金融机构作为基石:贝莱德、路博迈等全球顶级资产管理公司多次参与大额融资,还包括 D1 资本、Altimeter Capital、1789 Capital。

产业资本深度参与:三星、思科、德国电信资本合伙公司(DTCP)等产业巨头的投资不仅是财务行为,更是战略合作。例如,这可能涉及到芯片生产、数据中心部署或市场渠道的合作。

专业基金持续领投:Disruptive(长期领投方)、Infinitum,其中,以 Disruptive 为代表的风险投资基金,在 2025 年的最新一轮 7.5 亿美元融资中担任领投方。

不过,近 70 亿美元的估值与 2024 年 9000 万美元的营收相比,溢价极高

其 2025 年营收预期已大幅下调。2025 年 7 月,Groq 将其 2025 年的收入预期从 20 亿美元大幅下调至 5 亿美元。原因可能与部分大额订单(如与沙特阿拉伯的协议)交付延迟,以及数据中心建设进度有关。

Groq 此前告知投资者,其 2026 年收入将增至近 12 亿美元(约合人民币 86 亿元),到 2027 年将超过 19 亿美元(约合人民币 136 亿元),主要来自向其他公司直接销售硬件。

截至 2025 年中,Groq 手头现金流超过 20 亿美元,该公司资金储备依然充足,支撑其后续扩张。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

英伟达 ai 谷歌 芯片 gpu
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论