来源:猎云网
5 月 28 日,据墨芯人工智能消息,墨芯人工智能近日正式完成 C 轮融资,金额近十亿元人民币。
据悉,本轮融资汇聚了深创投、岩山科技、大湾区共同家园、力鼎资本、蕴盛资本等重磅产业资本及市场化机构,凯旋创投、创享投资、盛景嘉成等多家老股东共同参与。
融资宣布之际,公司核心产品:全新一代计算卡 SparsePrime ®(以下简称 "SparsePrime ® ")将于今年内正式推出。SparsePrime ® 计算卡是一款面向智算中心和数据中心的高性能 AI 通用推理计算卡,基于自研的 Antoum2.0 芯片架构,专为大模型与复杂推理场景优化设计。
该产品采用自顶向下的整体设计理念,广泛适用主流 Transformer 模型,强化通用适配性,配备完善的工具链,实现客户零接受成本、快速获得稀疏加速。开发者现有的基于 PyTorch、TensorFlow 的模型代码,以及高效的 vLLM 等推理框架,能够近乎零代码修改地完成迁移并直接部署运行,同时支持开发者使用 Triton 语言进行自定义算子开发,最大程度降低使用门槛。SparsePrime ® 将基于多个算力中心千卡集群部署中积累的真实负载数据,在稀疏计算效率上实现新的突破,进一步夯实墨芯在 AI 推理算力领域的差异化竞争力,初步实现精度无损,算力翻倍的技术路径可能。
SparsePrime ® 的底气,源于墨芯在稀疏计算领域持续积累的技术实力。在此之前,墨芯旗下 S30、S40 等计算卡已在国际权威 AI 基准测试 MLPerf ™ Inference 中连续三届夺冠,在视觉、自然语言处理、大模型等主流模型任务上展现出领先的能效比与单位算力推理吞吐量,以显著低于行业旗舰产品的功耗达成更优推理性能,充分验证了稀疏计算在真实数据中心负载下的工程可行性与商业价值。
据悉,融资资金将重点投向全新一代计算卡 SparsePrime ® 的量产与商业化,以及全国算力网络版图的进一步扩张。


登录后才可以发布评论哦
打开小程序可以发布评论哦