智东西
作者 | 李水青
编辑 | 漠影
智东西 8 月 12 日报道,2025 世界人工智能大会(WAIC)期间,由国务院国资委统筹指导、中国移动牵头建设的国家级 AI 开源开放平台 " 焕新社区 " 正式启动。这一平台肩负着整合央企资源、推动 AI 普惠发展的战略使命,已有 90 余家央企、50 余所高校及 20 余个组织加入。
作为首批共建单位,中兴通讯正式开源 NTele-R1-32B-V1、7B-Curr-ReFT、3B-Curr-ReFT 等 6 款自研发模型及 5 个行业数据集,以及 "Co-Sight 超级智能体 " 和配套工具链,为 AI 国家队提供技术动能,展现出 ICT 巨头向 AI 技术输出者的成功跨越。
成立 40 年的中兴通讯,不仅是全球 5G 先锋,更凭借 " 芯片 + 硬件 + 软件 + 应用 " 的软硬件综合优化及全球交付能力,成为央企数智化转型的关键伙伴。
近日,通过对话中兴通讯战略和生态首席专家屠嘉顺、中兴通讯星云通信大模型研发总工刘昆麟博士,我们对这家 ICT 巨头的 AI 实力以及 6G+AI 等垂直行业未来趋势发展有了更深入认识。
一、三大核心能力,40 年 ICT 经验助百家央企智能化转型
" 焕新社区 " 定位独特,屠嘉顺指出:" 它是一个更聚焦央国企和 To B 垂直领域的 AI 生态平台。所有的大模型及数据集,基本都面向 To B 的产业需求。" 其核心使命是解决大模型在百家央企真实场景的落地难题。
中兴通讯以 " 技术输出者 + 生态共建者 " 双重身份,通过三大能力精准补位:
1、模型与数据集开源:小样本的 " 精兵 " 策略
中兴通讯首批开源 6 个自研大模型及 5 个行业数据集,覆盖电信、多模态等关键领域,并计划持续开放训练方法、算法框架等底层能力,为国家队开发者提供基础技术支撑。
其明星成果——电信大模型 NTele-R1-32B-V1,仅用 800 个精选样本(400 数学 +400 代码),即在多项测评中超越 Qwen3-32B、QwQ-32B 等行业标杆。
中兴通讯还基于其创新训练范式,开源了 7B-Curr-ReFT 和 3B-Curr-ReFT 轻量化模型。3B-Curr-ReFT 在 AI2D 数学推理测试中准确率达 83%,超越 26B 参数的 InternVL-26B(79%)和 32B 参数的 Llava-Next-32B(81%)。
2、国产 AI 芯片生态协同:做开放的 " 连接者 "
面对 GPU 算力的短板,中兴联合国产 GPU 厂商开展软硬件协同优化。屠嘉顺坦言:"GPU 算力确实是一块短板,需要耐心突破。但中兴的独特价值在于‘连接’,即集群 GPU 之间的互连技术。"
他进一步描绘了生态愿景:" 我们想象中未来的计算生态应是开放的,能将多个厂家的 GPU 放在一个资源池里协同工作。中兴致力于成为这个开放生态的‘连接者’和‘使能者’。" 不再依赖单一来源,可有效规避因个别厂商断供、技术封锁等带来的风险,这正推动着国家队智算体系的稳定性与自主可控性。
3、智能体应用落地:从 " 打工人 " 到 " 指挥官 "
值得一提的是,中兴通讯本次还开源了 "Co-Sight 超级智能体 " 及配套工具链,降低开发者创新门槛。这一超级智能体在 GAIA 基准测试中以 72.72 分夺冠。其采用 " 主管智能体 + 执行智能体 " 的协同架构和 DAG 任务引擎,将行业研究周期从数周压缩至 1 小时。
刘昆麟生动地解释了其进化:" 常规智能体像一个‘打工人’,而超级智能体更像一个‘指挥官’,能调度各种已有的智能体或服务功能协同作战。"
从技术生态视角看,中兴通讯的参与并非简单的资源堆砌,而是通过 " 模型 – 数据 – 硬件 – 应用 " 的全链条协同,为焕新社区构建起完整的技术支撑体系。
依托 40 年 ICT 经验,中兴的技术输出直击产业痛点。以电信运维为例,其自研星云大模型驱动的 " 网优专家 " 系统在云南移动实现了网络优化全流程自动化,非现场处理时长缩短 20%,用户上行速率提升 30%,有力推动了运维从 " 人工经验 " 向 " 数据驱动 " 的跃迁。
现在,这家 ICT 巨头正将其 40 年 ICT 经验迁移到百家央企数智化转型过程中,成为中国 AI 国家队不可或缺的核心力量。
二、全栈输出:从电信到千行百业,打造新质生产力
尽管大众印象中的中兴 " 强在硬件 ",但其核心竞争力实为软硬件协同优化和一站交付的全栈能力。
屠嘉顺精辟总结道:" 中兴的核心竞争力是做软硬件的协同优化,并提供‘交钥匙’的解决方案。这不是简单的卖设备,而是结合客户现有行业场景,致力于成为客户数智化转型路上的长期伙伴,通过清晰的阶段规划与持续的技术赋能,帮助客户一步步将数智化蓝图转化为现实。"
2023 年启动大模型战略后,中兴在 2025 年迎来技术爆发期:
1、小样本训练匹敌大模型:三阶数据管理直击数据痛点
中兴通讯开源的电信大模型 NTele-R1-32B-V1,以 " 小样本高效训练 " 实现性能超越,成功实践了 " 数据质量优于数量 " 的路径。
刘昆麟博士再次强调了其底层逻辑:" 这并不意味着大模型对数据量的依赖被彻底打破,而是证明:如果能找到‘量身定制’的关键数据,少量样本也能激发出匹敌大量数据的效果。"
具体来看,NTele-R1-32B-V1 实现了三阶数据管理策略的创新突破,直击大模型训练中 " 数据冗余与模式固化 " 的行业痛点:
(1)优选 " 教师模型 ",锚定高质量参考样本。研发团队选定 QwQ-32B 作为 " 教师模型 ",对初始 S1 数据集中的每个问题抽样 50 个回答,确保知识蒸馏的 " 源头质量 "。
(2)筛选高难度样本,强化复杂任务处理能力。研发团队对样本问题的回答正确性进行量化评估,保留高难度样本形成 S-hard 数据集。这种 " 靶向训练 " 策略使模型聚焦复杂任务,训练效率提升 40%。
(3)构建多样化推理路径,打破模式固化。通过计算每个问题答案之间的列文施泰因距离(字符串相似度指标),为每个问题选择最多 5 个距离最远的答案,最终形成包含 965 个样本的训练数据集,从而有效避免蒸馏过程中模型 " 死记硬背 " 单一推理路径的问题,显著提升了模型的泛化能力。
该模型的技术价值不仅在于性能指标的领先,更在于为中国 AI 国家队提供了 " 小样本训练 " 的可复制方法论。刘昆麟告诉智东西,这种聚焦场景建模、精炼数据的方法论,已成功复制到钢铁、水利等行业。
2、轻量化模型打破参数迷信:后训练激发模型智能
多模态智能领域长期存在 " 参数规模决定性能 " 的固有认知,中兴通讯推出的 Curr-ReFT(Curriculum Reinforcement Fine-Tuning)训练范式,使 3B、7B 参数的轻量化视觉语言模型(VLM)在多项任务中超越 26B、32B 大模型。
Curr-ReFT 的创新点集中在 " 课程式强化学习 " 与 " 基于拒绝采样的自提升 " 两大模块,形成闭环优化体系:
(1)课程式强化学习:三阶递进式能力培育。研发团队借鉴人类认知规律,将训练任务分为三个难度递增阶段,配合分层奖励机制,使模型能力稳步提升:
第一阶段(二元决策学习):通过 " 是 / 否 " 类简单任务(如 " 这是苹果吗?"),快速建立基础视觉理解与简单推理能力,奖励函数聚焦 " 准确率 "。
第二阶段(多项选择学习):引入多选项任务(如 " 水果里哪个最大?"),强化模型的细节分辨与决策能力,奖励函数兼顾 " 准确率 " 与 " 推理步骤完整性 "。
第三阶段(开放式回答学习):以复杂开放式问题(如 " 描述这幅画的故事 ")激活综合推理能力,奖励函数涵盖 " 逻辑性 "" 流畅度 "" 信息完整性 " 多维度。
(2)拒绝采样自提升:平衡能力提升与基础技能保留。为避免模型在提升复杂推理能力时丢失基础语言技能,研发团队采用两步优化机制:
高质量样本筛选:引入大尺寸模型作为教师模型,从模型生成结果中筛选评分超过 85 分的样本(评估维度包括准确性、逻辑性、格式规范度),构建精编数据集。
自我迭代优化:以精编数据集为参考,同时混合少量多任务多领域高质量多模态数据,通过持续对比修正模型输出,在提升复杂任务处理能力的同时,确保基础语言技能不退化。
刘昆麟对此技术趋势判断明确:" 所谓的‘参数规模决定性能’的行业认知,应该早就过时了。关键在于如何通过后训练(如强化学习)更充分地激发模型潜能,将预训练阶段掌握的模糊概念凝练成解决实际业务的能力。"
他进一步指出业界共识的转变:"OpenAI 近期也提出,未来强化学习可能占算力消耗的大部分,预训练只占一小部分。"
3、6G 前沿的务实 " 干粮 ":从 " 考题 " 到 " 生产力 "
整合 40 年电信领域知识,中兴通讯开源了 TFCE(Telecom Function-Calling Evaluation)数据集,成为中国 AI 国家队在通信行业的核心 " 技术弹药 ",填补了全球电信领域函数调用评估的空白。
TFCE 数据集包含 1800 余个通信专用函数、917 道 Python 实战题目,覆盖 4G、5G、6G、无线通信网络优化、物联网、网络安全等全场景,被刘昆麟称为电信 AI 的 " 标准考题 "。
他阐释了其设计理念:"TFCE 避免简单的知识问答,聚焦于通信网络的智能化运维、优化业务和渐进式创新。题目设计源于真实产业痛点,是‘实战化考题’。" 这体现了中兴将 40 年工程经验转化为 AI" 养分 " 的务实作风。
TFCE 的推出为中国 AI 国家队带来多重价值:提供统一的电信 AI 模型评估标准,降低通信行业 AI 开发的入门门槛,并加速电信领域 AI 技术迭代,通过标准化测评推动模型向 " 高准确率、高适配性 " 进化。
屠嘉顺提到,未来 6G 网络中的 AI 是原生的,6G 是一个会思考的网络——在 6G 中我们可以实现云边端响应时间控制,通过边缘大模型及终端小模型,为 6G 网络管道提供思考能力,让智能无处不在。
当下,开源模型大战竞争激烈,中兴通讯相比于互联网大厂的差异化护城河何在?
屠嘉顺一语道破本质:" 方向上有较大区别。现在的互联网公司大量做 To C 业务,中兴更聚焦 To B 领域,用‘连接 + 算力’全栈能力为钢铁、电力、金融等行业提供端到端解决方案。" 其护城河源于三方面:
1、前瞻布局:随着 2022 年底 ChatGPT 爆发,整个通信行业深受其影响。中兴通信发现 6G 是 AI 内生的,2023 年初就制定大模型战略,2024 年发布千亿级 MoE 通信模型,至今加速迭代出多款开源大模型及数据集,落地行业,并成为焕新社区的技术输出者。
2、场景 Know-How:40 年电信经验沉淀为可复用的行业知识图谱。刘昆麟强调:" 数据只是表象,真正护城河是能稳定产生数据的场景。真正产生价值的,是让模型到真实系统里去交互,这一过程积累的语料和迭代经验,是比单纯数据更高效的资产。"
3、研发效能革新:中兴通讯内部进行了 AI 研发绩效工具创新,从而大幅提升人效,加速了技术迭代。
从电信行业中来,到千行百业中去。行业案例成为中兴通讯全栈实力的最佳印证。
在云南泼水节保障案例中,面对 200 万游客的网络洪峰,中兴 " 大模型 + 智能融合板 " 双智协同体系对 180 个基站实施精准护航,达成 " 零卡顿感知、零中断服务、零重大投诉 " 的 " 三零 " 目标,高负荷小区占比降 20% 以上,直播上行速率提升 30%。
结语:AI 使能者入局,加速 AI 普惠新生态
从 NTele-R1-32B-V1 的小样本 " 精兵训练 ",到 Curr-ReFT 激发小模型的 " 潜能革命 ";从 TFCE 深入产业的 " 标准考题 ",到 Co-Sight 指挥多智能体的 " 超级指挥官 ",中兴通讯以全栈开源的 " 干粮 ",为 AI 国家队构建起坚实的技术底座。其星云大模型已在电力、金融、钢铁等千行百业落地生根。当这家拥有 40 年深厚 ICT 功底的巨头,以开放之姿躬身入局 AI 国家队,以 " 交钥匙 " 的务实态度赋能百家央企,中国 AI 的 " 新质生产力 " 图景,正加速从愿景照进现实。
登录后才可以发布评论哦
打开小程序可以发布评论哦