36氪 1小时前
2026AI Partner·北京亦庄AI+产业大会
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

中国工业物理 AI 的真正优势不在模型参数,而在全球 12 倍的工业机器人部署密度、两倍的发电量和密集的 5G 边缘节点——场景密度、基建底座和开源模型的合力,正在推动物理 AI 从实验室走向规模化落地。

江行智能提出工业物理 AI 的三层模型,这套系统已在新能源场站和电网巡检场景落地——覆盖贵州、内蒙古等多地,核心算法准确率达 99%。陈龙特别指出,工业场景下一个看似简单的巡检任务通常需要拆成 100 到 200 个子任务,这对 AI 的稳定性和可靠性提出了远超消费级应用的要求。

以下为演讲内容,经 36 氪整理编辑:

陈龙丨江行智能基模 CTO

各位嘉宾、行业伙伴下午好,我是来自江行智能的具身基模 CTO 陈龙,我的分享题目是从感知环境到改变世界:物理 AI 的机遇、路径和挑战。

AI 的竞争已经从数字世界的模型参数之争,转向了真实物理世界的系统能力之争。中国凭借独特的五层产业基础,正在成为全球工业物理 AI 落地的最佳土壤。江行智能通过打造全栈工业物理 AI 模型架构,已经在新能源、电网等核心领域实现了规模化部署,证明了物理 AI 从概念走向现实的可行性。

AI 竞争正在从模型竞争走向物理系统竞争

过去几年,生成式 AI 在数字世界充分证明了自身价值,能够完成内容生成、代码编写、智能问答等任务。但对于工业企业而言,真正的价值前线不在屏幕里,而在风电场、光伏电站、变电站、矿山、化工园区和生产车间这些真实的物理空间。

AI 正在经历从 " 生成答案 " 到 " 执行任务 " 的关键演进。当 AI 走进工业现场,竞争的核心不再是模型参数规模或单点算法准确率,而是能否将人工智能稳定、可控、低成本地部署到真实物理世界。工业现场的任务从来不是 " 看一张图判断有没有异常 " 这么简单,它需要完成数据采集、环境理解、设备接入、任务规划、执行反馈和闭环迭代的全流程。这意味着物理 AI 不是一个孤立的模型,而是一套能够在现场持续运行的完整智能系统。

中国工业物理 AI 的五层基础与三大结构性机会

为什么工业物理 AI 在中国拥有最好的落地条件?中国已经形成了其他国家难以复制的五层系统性基础。

第一层是应用层。中国拥有全球最高密度的工业场景,工业机器人安装量约为美国的 8.6 倍,过去十年增长了约 12 倍。真实场景越密集," 数据 - 模型 - 具身智能机器人 " 的闭环就越容易形成。

第二层是模型层。以 DeepSeek、通义千问(Qwen)、Kimi 为代表的国产化开源模型追赶迅速,性能快速逼近行业最优水平,并已在全行业完成广泛的垂直化部署,越来越贴近产业的实际需求。

第三层是基础设施层。中国 5G 基站数量已超过 448 万,全球占比超过 60%,同时新增发电容量也远超美国。这使得我们在端侧和边缘侧拥有更强的网络与基建能力,能够更好地支持物理 AI 设备的现场接入与实时交互。

第四层是芯片层。不可否认,我们在高端训练芯片领域与美国仍存在差距。但这一挑战也倒逼行业走上了更高效的技术路线,推动企业通过更优的模型结构、端边协同和软硬件联合优化来最大化现有硬件的性能潜力。

第五层是能源层。当前中国发电量约为美国的两倍,发电机组装机量更是达到美国的三倍。充足且稳定的能源供给,为 AI 从云端训练走向大规模现场部署提供了长期的底层支撑。

这五层基础叠加在一起,使中国工业物理 AI 不只是有技术想象,更有真实的落地土壤。在此基础上,我们总结出中国工业物理 AI 的三类核心结构性机会。

第一类是供给侧底座机会。能源、网络、基础设施和边缘节点的持续完善,为 AI 进入工业现场提供了长期可靠的支撑。

第二类是现场侧闭环机会。高密度的工业场景、大规模的机器人部署和多模态传感设备,让物理 AI 能够形成 " 部署 - 采集 - 训练 - 迭代 - 再部署 " 的完整数据飞轮,这是其他国家无法比拟的优势。

第三类是效率侧路线机会。高端芯片的约束会推动行业走向更高效的模型、更强的边缘智能和更深的软硬协同,使工业物理 AI 更加注重低成本、可控性和可部署性。

江行智能的定位,正是把这些组合优势组织成可部署、可复制、可持续迭代的工业物理 AI 系统。

江行智能全栈工业物理 AI 模型架构

工业现场的问题不能靠单一模型解决,它需要数据基础设施、物理世界建模、行业大模型、应用框架、设备控制和安全机制协同工作。基于这一认知,江行智能打造了面向工业场景的三层全栈物理 AI 模型架构,围绕工业物理 AI 对自主性、多模态、长任务和可靠性的核心需求设计。

数据与基础设施层:JX-Phi World 双轮驱动

作为整个架构的底座,JX-Phi World 采用 AutoEdge 和 AutoWorld 双轮驱动的核心设计,解决模型训练更快、落地更稳、成本更低的问题。

AutoEdge 负责真实工业数据的全流程处理,包括多模态环境数采、云端训练、边端推理、模型部署和 OTA 升级。它能够持续采集真实现场的任务、设备、工况和反馈数据,同时通过边缘侧推理显著降低网络传输压力与模型端到端时延。底层数据涵盖了传感器、热成像、无人机巡检以及低轨卫星遥感等工业现场的全维度信息。

AutoWorld 则是世界模型仿真和数据引擎。工业 AI 的一大痛点在于,很多关键异常并不高频发生,但一旦发生就必须准确识别和可靠处置。真实工业数据通常只能覆盖 90%-95% 的常规场景,对于极端天气、突发事件等 5% 的潜在风险与极端工况存在数据缺口。AutoWorld 通过生成式 AI 与 3D 重建技术,模拟生成各类罕见场景和复杂任务过程,支持 Sim-to-Real 迁移,让 AI 在仿真环境中把错误犯完,再部署到真实现场。

模型层:JX-Phi Brain 向工业场景 WAM 演进

JX-Phi Brain 是整个架构的核心大脑,正在向工业场景 World Action Model(WAM)演进,融合了三类核心能力。

第一类是空间视觉语言模型(S-VLM),解决 " 感知 + 理解 " 的问题。工业现场不是一张平面图,而是包含设备、人员、空间关系、运行状态和行业规则的动态环境。S-VLM 不仅能够感知工业厂房的物理环境,还能理解各类传感器读数与环境参数,实现跨模态推理与工业场景建模。

第二类是长任务视觉语言动作模型(LT-VLA),解决 " 感知 + 执行 " 的问题。工业任务往往不是一步完成,而是多任务、多设备、多流程协同。LT-VLA 能够感知现场环境约束与任务要求,将复杂工业任务拆解为一系列可执行的子任务,并实现自引导式的任务优化与动态调整。

第三类是行业垂类模型,把电力、化工、矿山等行业的专业知识融入模型,使模型能理解强规则、强约束、强安全要求下的真实任务。目前江行已经在电力、化工、矿山等行业支持超过 1000 个场站和点位的常态化数据采集,持续构建 " 模型 + 数据 " 的闭环。

应用层:JX-Phi Agent 通过工业 Harness 与一脑多体实现价值落地

模型本身不会自动创造产业价值,价值发生在模型被封装成可部署、可调用、可监管的现场系统之后。JX-Phi Agent 应用层的核心是工业 Harness 和一脑多体控制两大技术。

工业 Harness 负责把任务拆解、安全规范、工具调用、规则约束、异常响应和全程留痕组织起来。它让模型不是自由发挥,而是严格在工业流程和安全边界内运行,同时能够整合行业知识库与下游专用模型,对模型输出结果进行自动复核,并支持专家人工审核介入。

一脑多体则是面向复杂现场的协同控制引擎。核心是一个参数量达 100B 的全局预控制器,负责跨工区的全局任务调度与管理。一个站端大脑,可以接入无人机、机械狗、轮式机器人、固定摄像头、传感器、机械臂等多种终端,实现任务分配、状态同步、冲突消解和协同执行。目前该架构已在贵州山区电网、内蒙古沙漠光伏等复杂场景成功部署,实现了具身终端在客户侧的规模化应用。

四大关键技术支撑工业物理 AI 落地

为了支撑全栈架构的高效运行,江行智能在四大核心技术领域实现了关键突破。

第一项关键技术是动态可更新的工业场景底座。真实工业现场是动态变化的,一次性建好的三维模型很快就会和真实现场脱节。江行通过 TrackerSplat 技术解决了动态场景中的稳定重建问题,能够在机器人移动过程中清晰抓取仪表盘等关键传感器数据,有效过滤雨滴、电磁干扰等环境噪声。同时通过 SizeGS 技术解决了弱网环境下的三维内容压缩和传输问题,确保检测结果与中间决策能够稳定回传云端大脑。

第二项关键技术是世界模型与物理推演。工业现场真实试错成本极高,尤其在电力、能源、化工等场景,有些错误绝对不能在真实现场发生。江行通过世界模型把 " 真实、仿真、真实 " 组织成闭环训练,让机器人策略先在仿真中试错、评测和迭代,再迁移到真实现场,大幅降低了落地风险和成本。

第三项关键技术是多模态感知与根因分析。江行融合了红外热成像、可见光、三维空间信息、设备状态数据以及无人机、低轨卫星遥感数据,让模型不仅能够看到异常,还能理解异常发生在哪里、为什么重要、风险等级如何,以及下一步应该怎么处理。这实现了从 " 缺陷识别 " 到 " 缺陷理解 " 的跨越,为客户提供真正可执行的运维决策。

第四项关键技术是 VLA 执行闭环与一脑多体协同。江行通过 DyGRO-VLA 技术和一脑多体系统,让全局大脑完成语义理解、任务拆解、目标分配、路径规划和冲突消解,再由具身终端完成导航、避障、读数、复核、操作和状态回传。与消费级具身智能的短任务不同,一个简单的机械狗检查设备读数任务,在工业场景中通常要拆成 100 到 200 个子任务,还需要综合考虑地形、气候等环境因素。

两大标杆案例验证物理 AI 规模化价值

江行智能的全栈工业物理 AI 技术已在多个核心工业领域实现规模化落地,其中新能源风光场站和电网变电站是两个最具代表性的场景。

在新能源领域,江行打造了风、光场站物理 AI 运维系统,实现了升压站、光伏板区、风机区、周界道路等多区域的全域覆盖,支持 7 × 24 小时全天候巡检。系统已经在全国 600 + 站群级场景中验证,能够跨区域、跨站型、跨业主快速复制。传统人工巡检一个大型场站可能需要 30 天以上,而物理 AI 系统只需 2 天即可完成全站巡检,彻底重构了新能源运维的效率。

在电网领域,江行的变电站物理 AI 智巡系统构建了中枢大脑、具身大脑和可控终端的协同体系,实现了空地立体巡检和多终端协同执行。系统覆盖站内 1 万 + 高密度智巡点位,能够在 4 小时内完成单次全站巡检,核心算法准确率达到 99%,平均准确率达到 96%。目前该系统已覆盖全国 27 个省份,在国家电网和南方电网体系中完成了 500 + 场景落地。

特别值得一提的是,江行开发的搭载机械臂的机械狗,能够自主完成电表箱开启、设备读数读取、简单调压操作等复杂任务,特别适用于狭小空间、高危区域等人员难以到达的场景。该设备采用端边云协同架构,在机械狗本地部署了 8B 参数量的端侧推理模型,同时结合边缘与云端的算力资源,实现了高精度、低时延的作业能力。

江行智能作为工业物理 AI 的坚定实践者,坚信物理 AI 已经从概念走向了现实。下一阶段 AI 最重要的产业价值,不会只发生在屏幕里,而会发生在真实空间、真实设备、真实任务和真实生产力之中。

江行智能希望和更多产业伙伴一起,让物理 AI 走进真实工业现场,从感知环境开始,真正用智能改变工业世界。

谢谢大家!

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 机器人 陈龙 新能源 物理
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论