给 AI 建「流水线」，九章云极看清了什么？

当一个行业的核心问题开始转移，旧的基础设施就会在无声中失效—— AI，正在经历这样的时刻。

2026 年 3 月，国家数据局公布了一个数字：中国日均 Token 调用量已达 140 万亿；4 月，斯坦福人工智能指数报告写道，过去两年推理成本下降了 280 倍；Gartner 的预测则显示，2026 年将有 40% 的企业把 AI Agent 嵌入自己的业务系统。

这些数字拼在一起，看起来像是一个时代到来的宣告。

九章云极创始人兼董事长方磊打了一个比方：第一次工业革命，始于瓦特的蒸汽机，但真正定义那个时代的，是福特的流水线——它把天才的一次性灵感，变成了每个人都能享用的产品。

AI 正站在完全相同的拐点上：过去几年的大模型突破是 " 蒸汽机时刻 "，而现在，真正的考验是能不能建起那条 " 流水线 "。

但这条 " 流水线 "，究竟建起来了多少？

把视线从宏观数字移开，去问那些真正在大规模部署 AI 的工程师，你会发现数字的另一面，是一组依然悬而未决的问题——大量 Token 消耗并未转化为实际的业务成功，代码在本地、算力在云端的开发环境依然割裂，企业在评估 AI 项目的真实回报率时缺乏可靠的工具。

这些现象指向一个根源：整个行业缺少一套能够度量 " 智能生产 " 的基础设施。

6 月 17 日，九章云极正式发布 "AI 工厂 " 核心战略，推出基于 AI 工厂锻造的新一代智算云 Alaya NeW Cloud 3.0 ——一套从算力投入到专业智能交付的工程体系。

这是一家拥有超过十年 AI 技术积淀的公司，对当下这组困境给出的系统性回答。

理解它的设计逻辑，需要先把问题看清楚。

AI 工业化卡在了度量上

AI 产业的竞争重心，正在悄然转向。

九章云极副总裁胡宗星把这个转变拆成了三段历史：模型发明期，核心问题是 " 能不能做出更强的模型 "，基础设施形态是算法、参数和单点突破；产业验证期，核心问题是 " 能不能跑通行业场景 "，基础设施形态是项目制、PoC 和私有部署。

而现在，正在进入的是第三个阶段——智能工业化期，核心问题变成了 " 能不能规模化生产与交付智能 "，需要的基础设施是 AI 工厂、标准化生产和专业 Token。

胡宗星认为，前两个阶段，行业已经走完；第三个阶段，才是真正的硬仗。

它意味着基础设施的竞争逻辑已经彻底改变，而大多数企业赖以运转的基础设施，还停留在上一个阶段。这种错配，正在让三件事同时失效。

▎第一重失效：算力投入无法被标准化度量

今天，一家企业如果同时采购了不同架构的 GPU 和 NPU，它很难用一把统一的尺子回答：这笔钱到底换来了多少 " 有效算力 "？

不同芯片的 FLOPS 数字互不可比，不同厂商的 "X 卡时 " 定义各异，算力利用率更因架构差异天壤之别。

这不只是报表难看的问题，更深的麻烦在于：一旦说不清投入了多少，优化就无从下手——换芯片、调调度、改模型，哪个更值得试？根本没有判断的依据。

对于需要长期规划算力预算的智算中心运营方而言，这直接决定了采购能否理性化、资源能否跨平台调度、规模扩张的边际成本能否被真正管控。

没有统一的 " 度 "，就没有现代电力工业；同样，没有统一的算力度量，算力就无法成为可以被采购、被运营、被持续优化的社会级基础设施。

▎第二重失效：Token 单价已经不是成本标尺

Token 价格战打了两年，中端模型的 Token 单价已经接近为零。但对于企业而言，比起 " 每百万 Token 多少钱 "，更关心完成一项业务的总成本，即真实成本。

这两者的差距，远比想象中大。

假设一个 AI Agent 执行一项 20 步的自动化任务，每一步的成功率是 85%，那么整个任务完成的概率只有约 4%。如果把单步成功率从 85% 提升到 98%，任务完成率就会跃升至 67% ——模型的专业程度，在多步任务中产生的收益，是指数级而非线性的。

胡宗星把这个逻辑拆成了一个公式：AI 应用成本 =Token 消耗 × 推理时延 × 重试次数 × 人工兜底成本。

这意味着，任意一项失控，即使单 Token 再便宜，任务总成本也会面临失控的风险，这也解释了为什么在 Token 价格大幅下降的当下，很多企业的 AI 部署成本反而还在上升。

▎第三重失效：专业模型生产还停留在 " 手工作坊 " 阶段

每家行业客户都需要一个真正理解自己业务的专业模型，但今天，训练一个垂类模型的路径，往往是：收集数据、清洗数据、精调、评测、部署、运维——每一步都是定制的、不可复用的、需要大量人工介入的。

手工生产最大的问题，不只是慢，而且经验难以形成复用。一次金融领域的专业模型训练积累的业务知识，很难直接迁移到制造业的专业模型生产中；每个客户的模型交付，在数据和业务层面几乎都是从零开始的新项目。

这意味着，无论做多少个项目，边际成本都很难实质性下降。

大量企业因此陷在 PoC（概念验证）阶段出不来，从模型研发到上线动辄半年以上，模型交付，正是在 " 作坊化 " 里被大规模浪费。

三种失效，指向同一个本质：AI 竞争的形态已经改变，但工业化所需要的基础设施——一套能够标准化度量投入、降低任务完成成本，并实现模型规模化生产的体系——至今仍然缺位。

而这，正是九章云极试图填补的空白。

AI 工厂如何让「算力到智能」第一次可被计量

从本质上看，AI 工厂试图让 " 智能生产 " 第一次具备工业体系中的三要素：统一计量、标准生产与规模交付。

胡宗星在发布会上给 AI 工厂下了一个定义："AI 工厂，是智能工业化的工程底座。"

" 工程底座 " 这个定语，透露了产品的底层逻辑：一套能被度量、被管理、能持续优化的生产体系。工厂的本质，是一条可以持续运转、不断降低边际成本的生产线。

沿着这个逻辑，AI 工厂的完整链条可以概括为：DCU（标准化算力单位）→训练工厂（专业模型生成）→ Token 工厂（专业智能流通）→企业任务（价值实现）→数据回流（模型迭代）。

链条的起点是 DCU。九章云极把 DCU 定义为 1 度算力 =312TFLOPS*1 小时，第一次把异构、多厂商、多架构的算力资源折算成一个可以跨平台比较的标准量。

客户按 DCU 采购，不必理解底层芯片型号和集群拓扑，GPU、NPU、不同代际的芯片，都可以换算成统一的 DCU 单位进行采购和结算。

只有投入侧有了度量，生产才有核算的基础。

有了标准化的算力投入，下一步是把它转化为专业智能，这是训练工厂的任务。

训练工厂负责把 " 通用智能 " 冶炼为 " 专业智能 "，胡宗星特意用了 " 冶炼 " 这个词，其背后的工艺由四个节点构成：数据处理、领域精调、强化学习、评测反馈。

其中强化学习是最关键的一环，也是训练工厂区别于平台精调服务最核心的地方。

通用大模型经过领域精调之后，能更好地 " 回答问题 "；但只有经过强化学习，模型才能真正学会 " 完成任务 " ——拆解复杂目标、调用外部工具、在失败后调整路径。

胡宗星把这个区别概括为：让专业模型从 " 会回答 " 走向 " 会执行 "。

这个区别在 Agent 大规模落地的今天尤为重要，对企业而言，模型会不会回答问题早已不是门槛，真正的门槛是：模型能不能在有容错率约束、有工具调用链路、有业务边界限制的真实生产环境里稳定执行任务。

专业模型从训练工厂产出后，需要经过压缩、量化、评测和分发，才能进入下一段—— Token 工厂，胡宗星将这个 " 中间环节 " 称之为 " 模型转运 "，是专业智能从 " 被生产 " 到 " 被消费 " 之间不可省略的工程步骤。

Token 工厂则负责专业智能的流通与交付，不同于行业常说的推理工厂，推理工厂的出发点是资源调度，核心命题是如何把已有模型部署稳、服务好、延时低，优化的是单任务性能。

而 Token 工厂的出发点是价值交付，核心命题是如何把智能封装为可以精确计量的价值单元，优化的是规模化产出的效率。

这意味着 Token 工厂交付的不是泛化的 Token，而是分层分档的专业 Token ——消费级、专业级、前沿级，对应不同类型的模型、不同复杂度的任务和不同的服务等级。每一类 Token 的定义，对应的是它所封装的智能密度与业务价值，而不只是它背后消耗的算力成本。

在这个框架下，" 每任务完成成本 " 终于有了被计算的基础：投入侧用 DCU 度量，产出侧用专业 Token 度量，两者之间的转换效率，就是工厂效率。

胡宗星将其总结为：" 同样的 DCU，能不能生产更多、更稳定、更高价值的专业 Token，这就是工厂效率，也是客户价值。"

每一次企业任务的完成，都会产生反馈数据——成功了什么、失败了什么、哪里卡壳、哪个步骤需要人工兜底，这些数据会持续回流到训练工厂，驱动专业模型的下一代迭代。

至此，闭环完成。

AI 工厂因此不只是算力到智能的一次性转化，更成为了一个可以自我优化的生产体系，每一轮任务，都在为下一个更专业的模型积累原料。

这套体系为企业用户带来的变化，可以归结为三个更直接的结果：

第一，算力成本开始具备可预测性。通过 DCU 统一计量，算力投入不再依赖多厂商、多口径的碎片化统计，而是可以像电力一样被预算、被核算。

第二，智能交付效率显著提升。Token Factory 将底层芯片、模型与调度能力封装为标准化的 Token 服务，专业 Token 的分层分档交付，使不同复杂度的业务任务可以被更稳定地规模化执行，减少重复试错与人工兜底。

第三，模型能力可以持续复用与迭代。业务任务产生的反馈数据持续回流至训练工厂，驱动专业模型的下一代迭代，形成 " 越用越强 " 的价值增强回路。

工厂用得越多，模型越专业；模型越专业，任务完成率越高；任务完成率越高企业落地 AI 项目的综合价值可清晰衡量。这是双工厂区别于单纯算力租赁和推理服务的本质所在。

当前，智算赛道参与者日趋多元，综合云厂商、大模型企业、传统 IDC 服务商纷纷布局算力领域，行业竞争维度不断丰富。九章云极坚持独立智算云定位，走出差异化发展路径。

综合云厂商业务布局较为全面，同时覆盖算力、应用等多个领域。九章不竞争模型，不竞争应用，意味着它和每一家模型公司、每一家行业客户之间，理论上都不存在利益对立——平台的中立性，让它有可能成为整个生态的 " 公共基础设施 "。

而不做模型、不做应用，就意味着九章的价值，需要通过生态的繁荣来兑现。平台不以单一业务作为利润核心，价值依托整个产业生态共同成长实现。只有当足够多的专业模型在平台上被训练、被交付、被调用，当足够多的行业任务在 AI 工厂里跑通，平台的价值才得以实现。

这套体系要真正运转起来，前提是必须有足够多、足够好的专业模型进入 Token 工厂——没有专业模型，专业 Token 就是一个空概念。

于是，九章启动了 " 智算开放计划 "，计划遴选并孵化 1000 个高价值专业模型与智能应用，通过算力支持、技术共创、商业分成、市场联动，与行业开拓者深度绑定，这是整个双工厂体系能否成立的公开验证。

目前持有的筹码来自三处。

首先是已被验证的规模：九章累计服务超过 3 万次客户算力任务，平台上已经预置了 50 多款主流基座模型以及 100 余款的面向金融、制造、政务、科研等真实开源数据集。

其次是全栈自研的效率护城河：全栈自研的智算操作系统、算电协同优化、跨中心跨型号全局调度、模型量化与推理优化，五条路径相乘，构成独立于硬件之外的效率优势，即使竞争对手购入同等算力，也未必能在任务完成成本上达到同等水平。

第三是更远处的一个思考。当千倍降本实现、算力便宜如水电，什么会成为下一道关卡？九章的判断指向高质量产业数据，以及传统企业缺乏 AI 原生工作流与组织能力。打通算力这一关，正是为了让产业界尽早面对这些更深层次的 " 软性 " 瓶颈。

这个判断，或许是理解九章战略的另一个视角：AI 工厂既回应了当下的竞争格局，也提前布了一局棋——关于 " 算力之后是什么 "。

推理成本的下降，确实让 AI 进入了规模化应用的临界点，但下一阶段产业效率的真正决定因素，已经从 " 能否用 AI" 转向了 " 能否用工业化方式持续生产智能 "。

在这一点上，AI 行业仍处于基础设施重构的早期阶段：算力需要统一计量，智能需要标准化生产，模型需要工程化交付。

九章云极提出的 AI 工厂，本质上是在尝试回答一个更基础的问题：当 AI 从能力竞争进入工业化竞争阶段，谁来定义 " 智能生产 " 的基础设施标准？

这套体系的成熟度，最终取决于两个层面的验证：它能否支撑更多行业场景中稳定运行的专业模型，以及这些模型能否在真实业务中持续创造可衡量的价值。

雷峰网 ( 公众号：雷峰网 ) 雷峰网

雷峰网原创文章，未经授权禁止转载。详情见转载须知。

宙世代

一起剪

相关标签