2026-05-28 14:07

智东西
作者 | 程茜
编辑 | 漠影
智东西 5 月 28 日报道,今日,国产 AI 芯片创企墨芯人工智能宣布近日正式完成近 10 亿元 C 轮融资,这也是国产 AI 芯片企业最新一笔重磅融资。
本轮融资阵容多元,汇集了头部国资创投机构深创投,以及岩山科技、大湾区共同家园、力鼎资本、蕴盛资本等产业资本与市场化机构,老股东凯旋创投、创享投资、盛景嘉成等多家机构持续跟投。
与此同时,墨芯还官宣新产品落地进展,今年年底其全新一代高性能 AI 通用推理卡 SparsePrime 将发布。
作为国内少数走差异化稀疏计算路线的创企,墨芯已经亮出多款基于自研稀疏计算芯片的 AI 计算卡,构建起 " 技术自研深耕 + 客户场景落地 " 双轮驱动模式。
在硬件性能侧,墨芯 AI 加速卡在全球主流 AI 评测集 MLPerf 中两度夺冠,墨芯 S30、S40 单卡以及多卡集群的算力表现,均超过英伟达 A100、H100。
在商业化落地方面,墨芯已经在云端、边缘端、算力网络侧拿下不少商业化订单,并在全国多区域的千卡集群完成部署。
AI 算力热潮持续升温,资本集中涌入国产 AI 芯片初创企业,面对国产替代、商业化落地提速的行业趋势,墨芯已率先构建起成熟的商业化闭环体系。
在这一关键节点,智东西和墨芯董秘兼企业发展及资本市场部总经理王率宇、墨芯商业化副总裁尚勇进行了深入交流,试图找到墨芯在国产差异化算力赛道突围的背后秘籍。
一、顶级多元资方入局,新一代计算卡年底落地
算力时代红利加速释放,资本持续涌入国产 AI 芯片赛道,行业 IPO 节奏不断加快。身处这一浪潮之中,墨芯在资本与产品两端同步提速。
当下 AI 应用加速落地,行业算力需求结构已发生根本性转变。据多家行业机构测算,当前国内推理算力需求已攀升至训练算力的 10~15 倍,推理赛道成为算力竞争新主战场。与此同时,作为数字经济核心底座的算力网络建设也全面提速。
瞄准当下的算力红利与增量市场,墨芯的战略布局已然明确。
王率宇透露,墨芯新一轮资金将全力投向新一代 AI 推理计算卡以及算力网络部署。
一方面,墨芯将于年内推出全新一代 SparsePrime 计算卡。该产品定位智算中心、数据中心场景,是一款高性能 AI 通用推理卡,依托其自研 Antoum2.0 芯片架构打造,深度适配大模型及各类复杂推理任务。
墨芯新一轮资金将贯穿新一代计算卡的产品研发、量产到市场落地全环节,为后续拓展市场提供充足的资金储备。
SparsePrime 是墨芯交出的最新答卷,面对当下大模型的部署需求,其适用主流 Transformer 模型,支持客户零接受成本、快速获得稀疏加速,同时,开发者能基于 PyTorch、TensorFlow 的模型代码,以及高效的 vLLM 等推理框架,近乎零代码修改完成迁移并直接部署运行,并支持开发者使用 Triton 语言进行自定义算子开发降低使用门槛。
另一方面,墨芯已在西北、西南、华东、华北四大片区的数据中心实现部署,在多个行业场景和领域实现规模化应用。未来 1~2 年内,墨芯完成覆盖国内东、中、西全域更为广泛的算力网络布局。
此次融资与新一代计算卡即将落地,是墨芯阶段性成果的集中体现。
与此同时,墨芯也在构建稀疏化生态、加强产学研合作、打造开发者社区等,为其产品扩展铺路。
云端基模、垂类客户、算力网络三管齐下的布局,墨芯稳居算力赛道核心位置。
二、AI 加速卡性能超主流 GPU,已跑通真实场景验证、落地闭环
放眼整个行业,AI 算力体系正加速分化迭代。未来 AI 芯片的核心比拼,不再是算力、功耗的简单叠加,算力利用率才是真正的核心壁垒。
作为通过底层技术创新发力国产 AI 芯片突围的代表玩家,墨芯自研的双稀疏计算技术,已打破算力瓶颈,打造出高算力、低功耗、高性价比的算力解决方案。
稀疏计算的原理可以类比人脑,人在处理不同任务时,会激活大脑皮层的相应区域,无需调用整个神经网络,类比到芯片上,就是在不同的任务上进行稀疏激活。简单来说,稀疏计算就是通过底层创新、软硬协同设计,让神经网络模型消减冗余,以提高计算效率。
墨芯的差异化壁垒在于,其不是在算法层面简单剪枝,而是从软硬协同的角度,将稀疏计算融入芯片计算核中,使其性能达到最优。
这使得墨芯 AI 加速卡的性能已经超过主流 GPU。墨芯 AI 加速卡在全球权威 AI 测评 MLPerf 中连续三次夺冠,其 S40 在特定场景下峰值吞吐量性能相对 A100 有 2.9 倍的性能提升,相对 H100 也有 1.4 倍的领先,单卡性能领先。多卡算力表现中,4 卡 S30 比 4 卡 H100 高出 1.8 倍,甚至比 8 卡 A100 集群性能高出 1.2 倍。

如今,墨芯从芯片、计算卡到行业解决方案已实现全链条自研,这也成为其给客户带来差异化价值的根基。
然而,技术攻关只是第一步,更难的是深入场景。尚勇提到,墨芯走的这条路不是纯技术难题,还需要在各类业务场景中反复验证、试错,因此其本质是复杂的工程落地难题。
他举了一个例子,去年墨芯参与的算力集群项目中,其客户是非 AI 领域的制造业企业,企业的核心关注点很直接——在有限预算内拿到能效比较优的算力解决方案。墨芯研究人员通过分析其集群打造的整体解决方案,相对市面上的方案能降低 30%~50% 的成本,且能满足该企业的细分场景需求。
这样的技术深耕与场景打磨,才能让算力的价值被充分释放出来。
尚勇将墨芯的策略重点概括为 " 两条腿并行 ",技术端,依靠独家稀疏计算架构突破算力瓶颈,大幅提升算力利用效率与硬件密度;市场端,聚焦 AI 推理黄金赛道,依托推理业务与产业应用场景的强关联性,协同客户完成芯片定制化落地、规模化商用,实现技术与场景的深度绑定。
如今的墨芯,已形成 S4-S40 等的梯度化算力布局,能满足从传统小模型到小尺寸大模型,再到超大规模模型迭代的算力需求,其今年推出的新产品就是为下一个 3 年甚至 5 年的超大规模模型潜在算力需求而打造。

由此可以看出,真正能够重构算力成本、突破性能上限的,应是建立在底层架构级计算范式革新之上的。
三、瞄准 AI 降本刚需,墨芯已拿下多领域商业化订单
随着 AI 产业从技术尝鲜走向产业普及,降本、增效、适配、盈利成为检验 AI 芯片价值的重要标准,而与这一趋势一脉相承的墨芯,已经具备可规模化、可盈利、可复制的商业化落地能力。
拆解来看,增效已经从墨芯计算卡在主流测试中两次夺冠体现出来。降本方面,当下的重点便聚焦于单 token 使用成本。
国家数据局的数据显示,今年 3 月底我国日均 Token 调用量突破 140 万亿,和 2024 年初的日均调用量相比增长超千倍。面对庞大的调用需求,稀疏计算可在保障模型精度不变的前提下精简计算线程。落地到实际业务场景中,墨芯解决方案的单 token 运行成本远低于主流 GPU 产品,在部分特定场景更有优势。
基于此,王率宇透露,墨芯已经在云端、边缘端及算力网络侧拿下不少商业化订单,并预期明后年能实现盈亏平衡。
墨芯的快速成长,本质是契合了 AI 产业的核心变革趋势,在行业变化与不变中坚守稀疏计算核心路线,抢占万亿级市场红利。
一方面,墨芯坚持不变的稀疏计算技术价值正在释放。AI 应用落地的必要条件是边际成本逐渐下降,而这与墨芯计算路线不谋而合,他们坚持的正是通过技术创新不断降低应用成本,没有盲目追逐其他的领先技术。
另一方面,AI 产业的发展瞬息万变,墨芯就需要加速产品形态迭代,打造通用化产品体系兼容各类客户、各类场景的差异化需求。当下各类模型层出不穷,没有一家企业能精准预测其发展趋势,因此,在尚勇看来,墨芯就是始终以客户为出发点,保证产品在设计阶段就能满足其需求。
放眼到整个 AI 领域,模型厂商的商业化模型基本成型,降本成为全行业刚需,再加上 GPU 霸权逐步松动,国内多路径 AI 芯片迎来商业化爆发期,墨芯所处赛道的红利正持续释放。
结语:AI 推理需求爆发,稀疏计算乘风而起
AI 推理市场正迎来爆发风口。去年 9 月,英伟达创始人、CEO 黄仁勋在接受外媒采访时直言,AI 推理的增长,不是 100 倍、1000 倍,而是 100 亿倍。
瞄准这一行业大势,墨芯布局的稀疏计算技术具有先天优势。该技术天然适配推理场景的增效、降本需求,再加上墨芯以此为核心构建了软硬协同、场景验证、生态完善的差异化壁垒。
可以确认的是,伴随推理需求井喷,稀疏计算赛道也正式迎来爆发窗口期。
2026-05-28 14:07

智东西
作者 | 程茜
编辑 | 漠影
智东西 5 月 28 日报道,今日,国产 AI 芯片创企墨芯人工智能宣布近日正式完成近 10 亿元 C 轮融资,这也是国产 AI 芯片企业最新一笔重磅融资。
本轮融资阵容多元,汇集了头部国资创投机构深创投,以及岩山科技、大湾区共同家园、力鼎资本、蕴盛资本等产业资本与市场化机构,老股东凯旋创投、创享投资、盛景嘉成等多家机构持续跟投。
与此同时,墨芯还官宣新产品落地进展,今年年底其全新一代高性能 AI 通用推理卡 SparsePrime 将发布。
作为国内少数走差异化稀疏计算路线的创企,墨芯已经亮出多款基于自研稀疏计算芯片的 AI 计算卡,构建起 " 技术自研深耕 + 客户场景落地 " 双轮驱动模式。
在硬件性能侧,墨芯 AI 加速卡在全球主流 AI 评测集 MLPerf 中两度夺冠,墨芯 S30、S40 单卡以及多卡集群的算力表现,均超过英伟达 A100、H100。
在商业化落地方面,墨芯已经在云端、边缘端、算力网络侧拿下不少商业化订单,并在全国多区域的千卡集群完成部署。
AI 算力热潮持续升温,资本集中涌入国产 AI 芯片初创企业,面对国产替代、商业化落地提速的行业趋势,墨芯已率先构建起成熟的商业化闭环体系。
在这一关键节点,智东西和墨芯董秘兼企业发展及资本市场部总经理王率宇、墨芯商业化副总裁尚勇进行了深入交流,试图找到墨芯在国产差异化算力赛道突围的背后秘籍。
一、顶级多元资方入局,新一代计算卡年底落地
算力时代红利加速释放,资本持续涌入国产 AI 芯片赛道,行业 IPO 节奏不断加快。身处这一浪潮之中,墨芯在资本与产品两端同步提速。
当下 AI 应用加速落地,行业算力需求结构已发生根本性转变。据多家行业机构测算,当前国内推理算力需求已攀升至训练算力的 10~15 倍,推理赛道成为算力竞争新主战场。与此同时,作为数字经济核心底座的算力网络建设也全面提速。
瞄准当下的算力红利与增量市场,墨芯的战略布局已然明确。
王率宇透露,墨芯新一轮资金将全力投向新一代 AI 推理计算卡以及算力网络部署。
一方面,墨芯将于年内推出全新一代 SparsePrime 计算卡。该产品定位智算中心、数据中心场景,是一款高性能 AI 通用推理卡,依托其自研 Antoum2.0 芯片架构打造,深度适配大模型及各类复杂推理任务。
墨芯新一轮资金将贯穿新一代计算卡的产品研发、量产到市场落地全环节,为后续拓展市场提供充足的资金储备。
SparsePrime 是墨芯交出的最新答卷,面对当下大模型的部署需求,其适用主流 Transformer 模型,支持客户零接受成本、快速获得稀疏加速,同时,开发者能基于 PyTorch、TensorFlow 的模型代码,以及高效的 vLLM 等推理框架,近乎零代码修改完成迁移并直接部署运行,并支持开发者使用 Triton 语言进行自定义算子开发降低使用门槛。
另一方面,墨芯已在西北、西南、华东、华北四大片区的数据中心实现部署,在多个行业场景和领域实现规模化应用。未来 1~2 年内,墨芯完成覆盖国内东、中、西全域更为广泛的算力网络布局。
此次融资与新一代计算卡即将落地,是墨芯阶段性成果的集中体现。
与此同时,墨芯也在构建稀疏化生态、加强产学研合作、打造开发者社区等,为其产品扩展铺路。
云端基模、垂类客户、算力网络三管齐下的布局,墨芯稳居算力赛道核心位置。
二、AI 加速卡性能超主流 GPU,已跑通真实场景验证、落地闭环
放眼整个行业,AI 算力体系正加速分化迭代。未来 AI 芯片的核心比拼,不再是算力、功耗的简单叠加,算力利用率才是真正的核心壁垒。
作为通过底层技术创新发力国产 AI 芯片突围的代表玩家,墨芯自研的双稀疏计算技术,已打破算力瓶颈,打造出高算力、低功耗、高性价比的算力解决方案。
稀疏计算的原理可以类比人脑,人在处理不同任务时,会激活大脑皮层的相应区域,无需调用整个神经网络,类比到芯片上,就是在不同的任务上进行稀疏激活。简单来说,稀疏计算就是通过底层创新、软硬协同设计,让神经网络模型消减冗余,以提高计算效率。
墨芯的差异化壁垒在于,其不是在算法层面简单剪枝,而是从软硬协同的角度,将稀疏计算融入芯片计算核中,使其性能达到最优。
这使得墨芯 AI 加速卡的性能已经超过主流 GPU。墨芯 AI 加速卡在全球权威 AI 测评 MLPerf 中连续三次夺冠,其 S40 在特定场景下峰值吞吐量性能相对 A100 有 2.9 倍的性能提升,相对 H100 也有 1.4 倍的领先,单卡性能领先。多卡算力表现中,4 卡 S30 比 4 卡 H100 高出 1.8 倍,甚至比 8 卡 A100 集群性能高出 1.2 倍。

如今,墨芯从芯片、计算卡到行业解决方案已实现全链条自研,这也成为其给客户带来差异化价值的根基。
然而,技术攻关只是第一步,更难的是深入场景。尚勇提到,墨芯走的这条路不是纯技术难题,还需要在各类业务场景中反复验证、试错,因此其本质是复杂的工程落地难题。
他举了一个例子,去年墨芯参与的算力集群项目中,其客户是非 AI 领域的制造业企业,企业的核心关注点很直接——在有限预算内拿到能效比较优的算力解决方案。墨芯研究人员通过分析其集群打造的整体解决方案,相对市面上的方案能降低 30%~50% 的成本,且能满足该企业的细分场景需求。
这样的技术深耕与场景打磨,才能让算力的价值被充分释放出来。
尚勇将墨芯的策略重点概括为 " 两条腿并行 ",技术端,依靠独家稀疏计算架构突破算力瓶颈,大幅提升算力利用效率与硬件密度;市场端,聚焦 AI 推理黄金赛道,依托推理业务与产业应用场景的强关联性,协同客户完成芯片定制化落地、规模化商用,实现技术与场景的深度绑定。
如今的墨芯,已形成 S4-S40 等的梯度化算力布局,能满足从传统小模型到小尺寸大模型,再到超大规模模型迭代的算力需求,其今年推出的新产品就是为下一个 3 年甚至 5 年的超大规模模型潜在算力需求而打造。

由此可以看出,真正能够重构算力成本、突破性能上限的,应是建立在底层架构级计算范式革新之上的。
三、瞄准 AI 降本刚需,墨芯已拿下多领域商业化订单
随着 AI 产业从技术尝鲜走向产业普及,降本、增效、适配、盈利成为检验 AI 芯片价值的重要标准,而与这一趋势一脉相承的墨芯,已经具备可规模化、可盈利、可复制的商业化落地能力。
拆解来看,增效已经从墨芯计算卡在主流测试中两次夺冠体现出来。降本方面,当下的重点便聚焦于单 token 使用成本。
国家数据局的数据显示,今年 3 月底我国日均 Token 调用量突破 140 万亿,和 2024 年初的日均调用量相比增长超千倍。面对庞大的调用需求,稀疏计算可在保障模型精度不变的前提下精简计算线程。落地到实际业务场景中,墨芯解决方案的单 token 运行成本远低于主流 GPU 产品,在部分特定场景更有优势。
基于此,王率宇透露,墨芯已经在云端、边缘端及算力网络侧拿下不少商业化订单,并预期明后年能实现盈亏平衡。
墨芯的快速成长,本质是契合了 AI 产业的核心变革趋势,在行业变化与不变中坚守稀疏计算核心路线,抢占万亿级市场红利。
一方面,墨芯坚持不变的稀疏计算技术价值正在释放。AI 应用落地的必要条件是边际成本逐渐下降,而这与墨芯计算路线不谋而合,他们坚持的正是通过技术创新不断降低应用成本,没有盲目追逐其他的领先技术。
另一方面,AI 产业的发展瞬息万变,墨芯就需要加速产品形态迭代,打造通用化产品体系兼容各类客户、各类场景的差异化需求。当下各类模型层出不穷,没有一家企业能精准预测其发展趋势,因此,在尚勇看来,墨芯就是始终以客户为出发点,保证产品在设计阶段就能满足其需求。
放眼到整个 AI 领域,模型厂商的商业化模型基本成型,降本成为全行业刚需,再加上 GPU 霸权逐步松动,国内多路径 AI 芯片迎来商业化爆发期,墨芯所处赛道的红利正持续释放。
结语:AI 推理需求爆发,稀疏计算乘风而起
AI 推理市场正迎来爆发风口。去年 9 月,英伟达创始人、CEO 黄仁勋在接受外媒采访时直言,AI 推理的增长,不是 100 倍、1000 倍,而是 100 亿倍。
瞄准这一行业大势,墨芯布局的稀疏计算技术具有先天优势。该技术天然适配推理场景的增效、降本需求,再加上墨芯以此为核心构建了软硬协同、场景验证、生态完善的差异化壁垒。
可以确认的是,伴随推理需求井喷,稀疏计算赛道也正式迎来爆发窗口期。


登录后才可以发布评论哦
打开小程序可以发布评论哦