近10亿融资落地！墨芯加速稀疏计算商业化闭环，年底发新一代加速卡

2026-05-28 14:07

智东西

作者 | 程茜

编辑 | 漠影

智东西 5 月 28 日报道，今日，国产 AI 芯片创企墨芯人工智能宣布近日正式完成近 10 亿元 C 轮融资，这也是国产 AI 芯片企业最新一笔重磅融资。

本轮融资阵容多元，汇集了头部国资创投机构深创投，以及岩山科技、大湾区共同家园、力鼎资本、蕴盛资本等产业资本与市场化机构，老股东凯旋创投、创享投资、盛景嘉成等多家机构持续跟投。

与此同时，墨芯还官宣新产品落地进展，今年年底其全新一代高性能 AI 通用推理卡 SparsePrime 将发布。

作为国内少数走差异化稀疏计算路线的创企，墨芯已经亮出多款基于自研稀疏计算芯片的 AI 计算卡，构建起 " 技术自研深耕 + 客户场景落地 " 双轮驱动模式。

在硬件性能侧，墨芯 AI 加速卡在全球主流 AI 评测集 MLPerf 中两度夺冠，墨芯 S30、S40 单卡以及多卡集群的算力表现，均超过英伟达 A100、H100。

在商业化落地方面，墨芯已经在云端、边缘端、算力网络侧拿下不少商业化订单，并在全国多区域的千卡集群完成部署。

AI 算力热潮持续升温，资本集中涌入国产 AI 芯片初创企业，面对国产替代、商业化落地提速的行业趋势，墨芯已率先构建起成熟的商业化闭环体系。

在这一关键节点，智东西和墨芯董秘兼企业发展及资本市场部总经理王率宇、墨芯商业化副总裁尚勇进行了深入交流，试图找到墨芯在国产差异化算力赛道突围的背后秘籍。

一、顶级多元资方入局，新一代计算卡年底落地

算力时代红利加速释放，资本持续涌入国产 AI 芯片赛道，行业 IPO 节奏不断加快。身处这一浪潮之中，墨芯在资本与产品两端同步提速。

当下 AI 应用加速落地，行业算力需求结构已发生根本性转变。据多家行业机构测算，当前国内推理算力需求已攀升至训练算力的 10～15 倍，推理赛道成为算力竞争新主战场。与此同时，作为数字经济核心底座的算力网络建设也全面提速。

瞄准当下的算力红利与增量市场，墨芯的战略布局已然明确。

王率宇透露，墨芯新一轮资金将全力投向新一代 AI 推理计算卡以及算力网络部署。

一方面，墨芯将于年内推出全新一代 SparsePrime 计算卡。该产品定位智算中心、数据中心场景，是一款高性能 AI 通用推理卡，依托其自研 Antoum2.0 芯片架构打造，深度适配大模型及各类复杂推理任务。

墨芯新一轮资金将贯穿新一代计算卡的产品研发、量产到市场落地全环节，为后续拓展市场提供充足的资金储备。

SparsePrime 是墨芯交出的最新答卷，面对当下大模型的部署需求，其适用主流 Transformer 模型，支持客户零接受成本、快速获得稀疏加速，同时，开发者能基于 PyTorch、TensorFlow 的模型代码，以及高效的 vLLM 等推理框架，近乎零代码修改完成迁移并直接部署运行，并支持开发者使用 Triton 语言进行自定义算子开发降低使用门槛。

另一方面，墨芯已在西北、西南、华东、华北四大片区的数据中心实现部署，在多个行业场景和领域实现规模化应用。未来 1～2 年内，墨芯完成覆盖国内东、中、西全域更为广泛的算力网络布局。

此次融资与新一代计算卡即将落地，是墨芯阶段性成果的集中体现。

与此同时，墨芯也在构建稀疏化生态、加强产学研合作、打造开发者社区等，为其产品扩展铺路。

云端基模、垂类客户、算力网络三管齐下的布局，墨芯稳居算力赛道核心位置。

二、AI 加速卡性能超主流 GPU，已跑通真实场景验证、落地闭环

放眼整个行业，AI 算力体系正加速分化迭代。未来 AI 芯片的核心比拼，不再是算力、功耗的简单叠加，算力利用率才是真正的核心壁垒。

作为通过底层技术创新发力国产 AI 芯片突围的代表玩家，墨芯自研的双稀疏计算技术，已打破算力瓶颈，打造出高算力、低功耗、高性价比的算力解决方案。

稀疏计算的原理可以类比人脑，人在处理不同任务时，会激活大脑皮层的相应区域，无需调用整个神经网络，类比到芯片上，就是在不同的任务上进行稀疏激活。简单来说，稀疏计算就是通过底层创新、软硬协同设计，让神经网络模型消减冗余，以提高计算效率。

墨芯的差异化壁垒在于，其不是在算法层面简单剪枝，而是从软硬协同的角度，将稀疏计算融入芯片计算核中，使其性能达到最优。

这使得墨芯 AI 加速卡的性能已经超过主流 GPU。墨芯 AI 加速卡在全球权威 AI 测评 MLPerf 中连续三次夺冠，其 S40 在特定场景下峰值吞吐量性能相对 A100 有 2.9 倍的性能提升，相对 H100 也有 1.4 倍的领先，单卡性能领先。多卡算力表现中，4 卡 S30 比 4 卡 H100 高出 1.8 倍，甚至比 8 卡 A100 集群性能高出 1.2 倍。

如今，墨芯从芯片、计算卡到行业解决方案已实现全链条自研，这也成为其给客户带来差异化价值的根基。

然而，技术攻关只是第一步，更难的是深入场景。尚勇提到，墨芯走的这条路不是纯技术难题，还需要在各类业务场景中反复验证、试错，因此其本质是复杂的工程落地难题。

他举了一个例子，去年墨芯参与的算力集群项目中，其客户是非 AI 领域的制造业企业，企业的核心关注点很直接——在有限预算内拿到能效比较优的算力解决方案。墨芯研究人员通过分析其集群打造的整体解决方案，相对市面上的方案能降低 30%～50% 的成本，且能满足该企业的细分场景需求。

这样的技术深耕与场景打磨，才能让算力的价值被充分释放出来。

尚勇将墨芯的策略重点概括为 " 两条腿并行 "，技术端，依靠独家稀疏计算架构突破算力瓶颈，大幅提升算力利用效率与硬件密度；市场端，聚焦 AI 推理黄金赛道，依托推理业务与产业应用场景的强关联性，协同客户完成芯片定制化落地、规模化商用，实现技术与场景的深度绑定。

如今的墨芯，已形成 S4-S40 等的梯度化算力布局，能满足从传统小模型到小尺寸大模型，再到超大规模模型迭代的算力需求，其今年推出的新产品就是为下一个 3 年甚至 5 年的超大规模模型潜在算力需求而打造。

由此可以看出，真正能够重构算力成本、突破性能上限的，应是建立在底层架构级计算范式革新之上的。

三、瞄准 AI 降本刚需，墨芯已拿下多领域商业化订单

随着 AI 产业从技术尝鲜走向产业普及，降本、增效、适配、盈利成为检验 AI 芯片价值的重要标准，而与这一趋势一脉相承的墨芯，已经具备可规模化、可盈利、可复制的商业化落地能力。

拆解来看，增效已经从墨芯计算卡在主流测试中两次夺冠体现出来。降本方面，当下的重点便聚焦于单 token 使用成本。

国家数据局的数据显示，今年 3 月底我国日均 Token 调用量突破 140 万亿，和 2024 年初的日均调用量相比增长超千倍。面对庞大的调用需求，稀疏计算可在保障模型精度不变的前提下精简计算线程。落地到实际业务场景中，墨芯解决方案的单 token 运行成本远低于主流 GPU 产品，在部分特定场景更有优势。

基于此，王率宇透露，墨芯已经在云端、边缘端及算力网络侧拿下不少商业化订单，并预期明后年能实现盈亏平衡。

墨芯的快速成长，本质是契合了 AI 产业的核心变革趋势，在行业变化与不变中坚守稀疏计算核心路线，抢占万亿级市场红利。

一方面，墨芯坚持不变的稀疏计算技术价值正在释放。AI 应用落地的必要条件是边际成本逐渐下降，而这与墨芯计算路线不谋而合，他们坚持的正是通过技术创新不断降低应用成本，没有盲目追逐其他的领先技术。

另一方面，AI 产业的发展瞬息万变，墨芯就需要加速产品形态迭代，打造通用化产品体系兼容各类客户、各类场景的差异化需求。当下各类模型层出不穷，没有一家企业能精准预测其发展趋势，因此，在尚勇看来，墨芯就是始终以客户为出发点，保证产品在设计阶段就能满足其需求。

放眼到整个 AI 领域，模型厂商的商业化模型基本成型，降本成为全行业刚需，再加上 GPU 霸权逐步松动，国内多路径 AI 芯片迎来商业化爆发期，墨芯所处赛道的红利正持续释放。

结语：AI 推理需求爆发，稀疏计算乘风而起

AI 推理市场正迎来爆发风口。去年 9 月，英伟达创始人、CEO 黄仁勋在接受外媒采访时直言，AI 推理的增长，不是 100 倍、1000 倍，而是 100 亿倍。

瞄准这一行业大势，墨芯布局的稀疏计算技术具有先天优势。该技术天然适配推理场景的增效、降本需求，再加上墨芯以此为核心构建了软硬协同、场景验证、生态完善的差异化壁垒。

可以确认的是，伴随推理需求井喷，稀疏计算赛道也正式迎来爆发窗口期。