
把产业最真实的需求、最难啃的技术点、最具挑战性的任务,提前放到了年轻人面前,让他们在最初的职业启蒙阶段就认识到:国产 AI 生态一场面向未来的长期工程,需要更多 " 敢打硬仗 " 的建设者加入。
撰文|张贺飞
编辑|沈菲菲
9 月初的 2025 世界智能产业博览会期间,中科曙光协同 AI 芯片、AI 整机、大模型等 20 多家产业链上下游企业,共同发布了国内首个 AI 计算开放架构,被外界解读为国产智算的 " 安卓模式 "。
一个礼拜前的世界互联网大会乌镇峰会期间,中科曙光发布了采用 AI 计算开放架构的全球首个单机柜级 640 卡超节点 scaleX640,标志着国产智算生态从架构层开放走向了工程级落地。
相比封闭生态,开放的产业生态系统更加复杂,需要更多的开发者参与其中,而人才一直是整个产业的短板。能否培养出产业需要的人才生力军,直接关系到国产 AI 生态的发展进程。
草蛇灰线,伏脉千里。
时间回到 2020 年,中科曙光联合国家先进计算产业创新中心和一众知名高校、企业、学术机构共同筹办了第一届先导杯。和常规赛事最大的不同," 以实践为导向 " 始终是先导杯的鲜明标签,紧跟前沿创新和产业痛点,在高校和产业间搭建了一座桥梁。

刚刚结束的第六届先导杯上,来自三个参与者的故事,终于让外界读懂了中科曙光多年的坚持:并非是一个割裂的赛事,正在用 " 教学训赛 " 的综合培养模式,为中国 AI 产业培养后备力量。
01.
" 我们要解决人才的断层 "
山东科技大学的王威,目前在计算机科学与工程学院参与相关领域的研究工作。在此之前,他拥有国家超算中心多年的工作经历。
横跨产业界和学术界的 " 两栖 " 经历,让他对中国 AI 和高性能计算领域的人才现状,有一种旁人难及的清醒认知。" 最大的难点之一,就是人才培养和产业需求之间,存在一个断层。"
王威在采访中多次提及 " 人才断层 ",人工智能和高性能计算日新月异,而多数高校的教学内容还停留在课本上面,与产业界的真实场景严重脱节。结果就是,产业界迫切需要能 " 直接能够在国产平台上深度参与项目 " 的人才,高校毕业生却需要 " 一个很长的学习周期 " 才能真正上手。

作为第六届 " 先导杯 "ONNX Runtime 算子优化赛题的出题人,王威瞄准了 " 脱节的断层 "。
在赛题设计上,王威坦言:不是一道 " 练习题 ",而是产业界公认的一个 " 硬骨头 "。要求参赛学生基于海光 DCU 和 ONNX Runtime 推理框架,在确保输出精度满足误差标准的前提下,针对 Attention、BatchNormalization、Conv、LeakyReLU、GroupNormalization 核心算子进行性能优化。
背后有着双重考量。
第一是考验学生们的 " 复合能力 "。绝不是简单的编程任务,直接把负载均衡、显存压力、通信瓶颈等技术壁垒抛给了学生。
参赛学生不能再像过去那样只停留在书本概念上,必须打通一条完整的技术链路:首先要把 " 计算机体系结构中所学的核心知识 " 真正用上;其次要具备在国产软硬件生态上调试的 " 工程能力 ";最后还要在高强度的试错和优化中,磨炼出解决复杂问题的系统思维。
第二是关乎未来的 " 职业启蒙 "。在 " 自主可控 " 的战略下,发展国产 AI 生态已是必然,但生态的繁荣,归根结底靠的是 " 人 "。
作为高性能计算领域的研究者,王威深知底层优化工作的 " 枯燥 "," 可能三年才能入门,五年才刚刚有感觉。" 把真实的产业难题交给学生,希望他们从过去 " 站在教科书外看概念 ",变成 " 直接调试产业难题的人 ",认识到国产 AI 生态的瓶颈和机会,进而 " 主动去探索 "" 深入去学习 "。
让王威印象深刻的是," 有时候凌晨一两点,学生们还在问问题 "," 去年参加先导杯的本科生,比赛结束后毅然选择攻读高性能计算方向的研究生 "," 不少学生参加比赛后,找到了努力的方向 " ……
在国内的高校中,像王威这样的 " 布道者 " 还有很多,他们用源自内心深处的热爱,在学生们心中埋下了投身国产 AI 生态的种子。当越来越多的种子生根、发芽、开花、结果,曾经制约产业繁荣的人才断层,将被一批批具备工程实操力、系统思维的新生力量 " 填平 "。
02.
" 打了场从零开始的硬仗 "
山西大学的大二学生王嘉宇,是王威老师特别提到的一位选手。在第六届 " 先导杯 " 的决赛入围名单中,对比诸多名校的硕士乃至博士团队,刚读大二的王嘉宇无疑是个特例。
因为底层系统人才缺口较大,且存在人才培养标准不一、教育资源分布不均等问题,先导杯在 2024 年首次面向本科生开放报名,并创新引入了区域赛模式,面向西北、东北等地区开赛。

来自中西部高校的王嘉宇团队,没有被 " 相对有限的技术资源 " 束缚,用实打实的成绩证明了先导杯推动教育公平、赋能多元人才的价值。
大多数同学跟着学校课程按部就班时,王嘉宇就主动报名参加了学校的 " 超算队 "。虽然日常训练使用的是学校所能提供的早期算力资源(例如英伟达 V100),正是这份来之不易的机会,为王嘉宇打开了迈向超算世界的第一扇门,锻造了在比赛中面对全新平台时的适应力和冲刺力。
王威老师设计的 ONNX Runtime 算子优化赛题,对王嘉宇团队来说,不亚于是一场从零开始的 " 硬仗 "。
" 尽管中科曙光提供的文档和接口兼容性很高,迁移过程并没有想象中艰难,在比赛开始时还是走了一些弯路。由于硬件差异,需要针对海光 DCU 做更精细的调整,结合算子原理和硬件参数综合优化,导致早期的性能表现不太理想。"
初期的不顺利,并没有吓退王嘉宇团队。
他们花了很长时间学习中科曙光提供的培训课程,在线上积极和其他同学沟通,在技术社区内找资料,遇到不懂的问题就向出题老师请教,乃至整个国庆假期都在实验室 " 刷性能 "。最终找到了算子性能优化的正确路径:" 我们发现性能瓶颈更多来自访存而非计算,重新定义了 warp 大小,并尝试使用 warp shuffle 优化 attention 中的归约性能…… "
整个采访过程中,王嘉宇每每提到第一次把 attention、卷积跑通的细节,言辞中都难掩心中的兴奋劲儿。在他看来,比赛的意义不在名次,在于一次次 " 啃硬骨头 " 的过程,一点点去推敲每个性能指标背后的逻辑,看到性能指标不断被刷新,有一种 " 升级打怪 " 的快感。
也让我们见证了这支年轻团队强大的自驱力:没有因 " 平台不熟悉 " 止步,而是将挑战视为学习的机会,并在比赛过程中形成了问题建模、性能分析、参数迭代、算子验证的工程能力。
王嘉宇团队的故事不会是个例,折射出的是国产 AI 生态加速成熟的缩影:当先导杯为中西部高校学生搭建起通向前沿技术的舞台,他们能够近距离接触国产智算平台和产业真实问题,在真实的工程环境中验证理论、打磨能力,会有更多潜藏的年轻力量被看见。
03.
" 国产生态需要我们参与 "
如果说王嘉宇是凭借兴趣和自驱力扎进来的 " 初生牛犊 ",国防科技大学的研二学生朱天赐,则是一个 " 身在局中 " 的 " 准工程师 "。国防科大的熏陶、" 天河超算 " 的骄傲,在他心中种下了 " 使命导向 " 的担当。
早在本科阶段,朱天赐就做过一款手语识别应用,在比赛中拿到了不错的名次,限于算力和数据集的瓶颈,最终没有实现推广应用。那段经历让他意识到:没有智能算力的土壤,应用将无法真正扎根。
不同于王嘉宇从零开始的启蒙,朱天赐作为队长参加了 GMRES 和 ONNX 两道赛题的角逐,想要深入了解国产 AI 生态的真实痛点。

" 之前在学校课程学的是碎片化的知识,知道什么是体系结构、并行计算、内存带宽等概念,就像是零件盒里的螺丝、齿轮、弹簧,并没有组装成能够运行的机械。通过先导杯的比赛,第一次把碎片化的知识,变成了解决实际问题的系统化能力。"
朱天赐遇到的第一个难题是优化 " 矩阵向量乘 " 算子,一个看似基础但极度考验体系结构理解的任务。
由于 " 矩阵向量乘 " 算子的性能瓶颈在于访存,海光 DCU 的 Wavefront 是 64 线程,和英伟达的 32 线程不同,意味着以前的优化习惯、经验参数不再适用,需要重新思考数据如何分块、访存如何对齐、调度如何设计。
为了解决这些问题,朱天赐和队友们一遍遍跑实验、画访存路径、调 tile size、做规约策略对比。有时候性能曲线不达标,就从硬件特性倒推数学计算、从数学表达式反推访存行为、从访存行为再反推并行策略…… " 纯理论不会直接带来性能提升,真正能提升性能的,是把理论转换成工程路径的能力 "。
" 硬核 " 的比赛过程,让朱天赐对国产 AI 生态有了更深刻的认知:国产算力平台的性能成熟度超出了预期,而且上手门槛比较低,但体系还不够完善,仍需更多开发者参与和打磨。
亲自上阵填补 " 缺口 " 经历,悄然影响了朱天赐的 " 自我定位 ":以前,他更多站在知识体系的外环,作为旁观者学习别人怎么做;现在,意识到自己正处在国产 AI 生态的前线,是需要主动 " 补位 " 的那群人。
谈到毕业后的职业规划时,朱天赐坚定表示:将从事算子优化、编译优化等方面的工作,为国产 AI 生态的繁荣添一块砖。
04.
写在最后
过去十年,中国的 AI 生态解决了 " 有没有 " 的问题。未来十年,问题将变成—— " 谁来用、谁会用 "。算力、架构、模型都可以通过技术迭代逐步补齐,唯有人才,是决定生态上限的 " 不可替代变量 "。
先导杯的价值,在于把产业最真实的需求、最难啃的技术点、最具挑战性的任务,提前放到了年轻人面前,让他们在最初的职业启蒙阶段就认识到:国产 AI 生态不是某一家厂商、某一所高校的战役,而是一场面向未来的长期工程,需要更多 " 敢打硬仗 " 的建设者加入。
有理由相信,最终改变国产 AI 生态曲线的,不是某一代架构、某一次发布会,而是被点燃的年轻力量。
主理人 | 张贺飞(Alter)
前媒体人、公关,现专职科技自媒体
钛媒体、36kr、创业邦、福布斯中国等专栏作者
转载、商务、开白以及读者交流,请联系个人微信「imhefei」


登录后才可以发布评论哦
打开小程序可以发布评论哦