清华系AI Infra厂商完成数亿元融资，以GPU为核心重构计算机系统架构

作者 | 乔钰杰

编辑 | 袁斯来

硬氪获悉，北京容芯致远科技有限公司（以下简称 " 容芯致远 "）近日完成天使轮数亿元融资。本轮由北京绿色能源和低碳产业基金与赛富投资基金领投，顺禧基金、富华资本、万利达集团、长江创新投、水木清华校友基金、梅花创投等跟投。云岫资本此前参与了公司种子轮投资，本轮继续跟投，并担任长期独家财务顾问。

AI 浪潮下，算力需求激增，传统以 CPU 为中心的架构瓶颈愈发凸显：CPU 成为数据调度与交互的核心限制，GPU 之间通信效率不足，内存无法实现统一地址空间共享，整体算力利用率较低。

容芯致远创始人石旭毕业于清华大学电子工程系，在芯片设计与 AI 领域从业多年，接受硬氪采访时，石旭表示，" 在实际部署中，典型的 AI 服务器配置需要多个 CPU 协同调度少量 GPU，且随着规模扩大，CPU 数量也需同步增加，系统复杂度与成本显著上升，这正说明传统架构难以适配 AI 时代的计算需求。"

基于此，容芯致远提出了以 GPU 为核心的 AI 计算体系—— AGC（AI computer system with the GPU as its Core）架构。该架构打破以 CPU 为中心的传统模式，将 GPU 作为系统核心计算单元，CPU 则转为外围控制组件。

通过这一重构，系统中 GPU 与 CPU 的比例（G:C）可由传统的约 2:1 提升至 20:1 甚至 32:1，大幅释放 GPU 算力潜力。

系统层面，AGC 架构进一步解决了内存一致性问题，支持单一操作系统统一管理多达 64 个 GPU，实现全局地址空间共享，避免跨节点数据拷贝，从而在大模型训练与推理等场景中显著提升整体效率。

这一体系创新并非单点优化，而是涉及全栈重构，包括 BMC 管理、交换系统、通信协议、推理框架、连接器等多个层面。

石旭介绍，在核心技术实现上，容芯致远围绕算力稳定性与利用效率展开了系统性创新。在硬件监控层面，公司自研 AI BMC 系统，将传统 3 – 5 秒级的轮询机制提升至微秒级响应，可在 GPU 温度异常等风险出现时即时触发降频或休眠策略，从而显著提升系统安全性与整体能效。

在可靠性设计上，传统八卡服务器一旦单卡故障，往往需要整机停机维护，恢复周期长、成本高。而在 AGC 架构下，单机可实现多达 20 个 GPU 的冗余设计。配合自研混存技术，系统可构建约 10TB 的混合存储空间，对健康 GPU 的 KV Cache 进行实时缓存。一旦某张 GPU 发生故障，系统可在 AI BMC 的快速响应下，迅速调度冗余 GPU 接替任务，并通过统一内存地址空间直接访问原有数据，实现计算过程无缝衔接。

基于这一机制，容芯致远可实现 GPU 故障情况下的 " 任务不中断热插拔 "（GPU RAID），将维护时间从约 2 小时压缩至约 1 分钟，同时显著降低运维成本。

互连层面，容芯致远推出 Blue Link 光互连方案，以 Mini LED/MICRO LED 替代传统激光光模块，在高温环境下具备更高稳定性，同时实现更高带宽密度与更长传输距离，突破了铜缆在带宽与距离上的物理限制。

生态策略上，容芯致远强调开放与兼容。石旭介绍称，由于显著降低了对 CPU 性能的依赖，其方案可适配龙芯、飞腾、海光等国产 CPU，同时兼容主流 GPU 厂商产品，构建起更为开放的计算生态。相较部分仅支持自研芯片的封闭体系，这一路径具备更强的产业协同能力。

与此同时，公司牵头发起 RISC-V 智算体系生态联盟，联合产业链上下游厂商作为生态伙伴，通过深度合作与专利共享，推动相关技术标准化与国产化规模落地。

产品层面，容芯致远已形成两大产品体系。一类为强调灵活性的 K 系列，兼容全球所有 PCIe 标准 GPU 卡，面向私有化部署场景，兼顾灵活配置与数据安全，主要型号包括 K2（两卡桌面型）、K4（四卡）及 K10（十卡）、K20（二十卡）。

K20 产品示例（图源 / 企业）

另一类为强调极致性能的 AGC 系列，通过定制化模组实现更高算力密度与系统效率，覆盖风冷，液冷及移动式等多种开放形态，支持多类特定 GPU，代表型号包括 AGC 64F（64 卡风冷），AGC 64L（64 卡液冷，提供 21P 算力与 3T 显存）， AGC 32F（32 卡风冷），AGC 16F（移动式 16 卡）及 AGC 2（两卡工作站）。

AGC 64F 产品示例（图源 / 企业）

商业模式方面，公司采取 " 自有品牌直销 +OEM 合作 " 的双路径策略，已与多家整机厂商展开合作，以联合方案形式推向市场。同时，公司推出子品牌 Upchanger，并与中央美院联合打造，聚焦艺术与渲染等细分场景。

以下为访谈节选（部分内容经编辑）：

硬氪：为什么容芯致远的 AGC 架构对国产卡非常友好？

石旭：传统以 CPU 为中心的架构，对 CPU 性能与生态依赖极高，这使得在实际部署中，很难将国产 CPU 与主流 GPU 体系有效结合，往往受限于数据交换能力与系统瓶颈，难以落地真正意义上的 " 全国产方案 "。而 AGC 体系通过将 GPU 上升为系统核心，大幅降低了对 CPU 的性能依赖，使国产 CPU 能够在体系中发挥作用，同时兼容国产 GPU，从而在现实工程层面打通全国产路径。

容芯致远的理念更像是安卓，我们很开放，兼容全球主流计算芯片，会更强调产业协同与规模扩展能力。在这一开放体系下，不仅整机厂商可以灵活组合硬件方案，上游 GPU、CPU 及连接器厂商也获得了更广阔的市场空间。AGC 本质上提供的是一个 " 连接平台 "，让不同厂商的产品能够在同一体系中协同运行，并随着系统演进持续优化性能与成本结构。

硬氪：您怎么定义容芯致远？

石旭：我们更像是 " 不做 GPU 的英伟达 "，希望去定义 AI 时代新的计算标准与架构范式，让智算进入每一个行业、每一个企业，每一个家庭及个人。目前我们也是工信部人工智能标准委员会成员。

任何计算体系的建立都离不开产业联盟的协同推进。传统 x86 通用计算体系背后，是由英特尔、AMD、微软以及大量硬件厂商共同构建的长期生态；而 AGC 所面向的 AI 计算，同样需要一套全新的产业协作网络。围绕这一目标，容芯致远正联合 GPU 厂商、CPU 厂商、整机厂商、连接器与器件厂商以及模型公司等多方力量，共同推动这个体系的落地与演进。目前正在组织和发起 AGC 架构生态联盟，未来将会以 AGC 架构为基础，进一步推动国产智算新标准新生态的落地。

投资方观点

北京绿色能源和低碳产业基金表示：" 随着 AI Agent 时代的到来，对算力成本的消耗将从训练逐步向推理演进。未来推理对算力的消耗将大于训练。单台 AI 服务器的性价比与兼容性将在未来成为算力企业的核心竞争力。同时，国产算力的瓶颈一方面受制于 GPU 的制程和单卡性能，另一方面受制于 IO 传输瓶颈及国产 CPU 性能。容芯致远掌握多项软硬件核心技术，打造新一代 AGC 计算体系，降低了对 CPU 性能的要求，可以适配国内外主流 GPU，并提高实际有效性能。此外还正在开发多项新一代技术，有效解决算力传输瓶颈。我们相信，随着容芯致远产品与技术的不断迭代，在 AI 算力需求激增和国产化需求迫切的时代下，容芯致远不断驱动行业创新，赋能国产 AI 产业发展。"

赛富投资基金负责科技赛道的管理合伙人蒋驰华表示：" 摩尔定律的物理红利正在无可避免地触顶。正如行业数据显示，在 2022 年之前的十年里，单芯片的计算性能曾实现了超 1000 倍的飞跃，但随着半导体工艺逼近物理极限，近几年的纯硬件性能增速已显著放缓。在当前以大模型为核心的‘ Token 工厂’时代，单靠芯片制程的演进已无法支撑算力需求的指数级爆发，计算系统级的架构颠覆才是破局的关键。这也是赛富投资基金坚定领投容芯致远天使轮的核心逻辑。容芯团队极具前瞻性地跳出了传统硬件堆叠的定式，提出了以 GPU 为核心的 AGC 计算体系，彻底打破了以 CPU 为调度中心的传统瓶颈。他们不仅仅在做单点优化，而是实现了系统层面的内存一致性与全局地址空间共享，并从底层光互连到 BMC 管理进行了软硬件的全栈重构。我们始终致力于寻找能定义未来的底层创新者。容芯致远正在重构适应未来的 AI Infra 标准，期待容芯的系统级代际颠覆能在当前的算力基建角逐中脱颖而出，以极致的算力利用率与高扩展性，真正加速 AGI 时代的全面到来。"

梅花创投董事总经理吴世鸿表示：" 容芯致远研发的 AGC 架构，以 GPU 为核心重构 AI 计算体系，彻底打破传统 CPU 中心化瓶颈，显著提升算力密度与 GPU 利用率，完美适配主流国产 GPU，是算力基础设施国产替代的关键一环。目前产品已快速获得市场验证，商业化落地节奏超预期，十分期待其 Blue Link 光互连方案尽快推向市场。创始团队是典型的技术领军 + 产业深耕 + 商业化能力的黄金组合，兼具技术深度与落地能力，赛道卡位精准、壁垒清晰、成长性极强，长期坚定看好容芯致远 AI Infra 领域的发展潜力！"

云岫资本创始合伙人兼首席执行官高超表示：" 在当前算力增长遭遇诸多系统性瓶颈的背景下，容芯致远以颠覆性的 AGC 架构以及整机解决方案，为国产智算开辟一条创新之路，公司产品在让 GPU 发挥更大算力效率的同时，兼顾了成本优势和灵活的适用性，开启了中国 AI 计算机系统架构创新的新范式。云岫资本坚定支持公司团队做难而正确的事，坚定看好公司会成为中国算力创新解决方案的重要破局者。"

宙世代

一起剪

相关标签