IT时报 08-11
国内首个开源大模型安全护栏来啦!DeepSeek服务器“裸奔”,主流模型安全堪忧
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

  中国电信给大模型 " 加护栏 "

作者/   IT 时报   孙妍

编辑/  潘少颖  

五年前,中国电信提出要打造世界一流的 " 服务型、科技型、安全型 " 企业。在 3 个月前举行的数字中国建设峰会智能云生态大会,中国电信董事长柯瑞文首次详解了 " 安全型企业 " 的重要建设成果。

而在 " 史上最热闹 " 的 2025 年世界人工智能大会(WAIC 2025)上,柯瑞文再次强调,中国电信正打造全方位人工智能动态防护体系,构建从基础设施、数据到模型以及应用的端到端安全保障体系,提升 AI 安全治理能力。

早在 2024 年 5 月,中国电信就宣布 "All in AI",成为全球率先明确未来 AI 战略的运营商。于是,转型 AI 首先成为中国电信的 " 内生基因 ",仅电信体系内部部署的基础模型和各类行业模型就已超过 100 个。在 " 内生外化 " 的过程中,其最先感受到 AI 安全的紧迫性:行业在认同人工智能会带来巨大变革作用的同时,也存在对其能否守住底线、防范风险的担忧。

天翼安全科技有限公司(以下简称 " 电信安全 ")在 WAIC 2025 上正式开源 " 见微 " 大模型安全护栏组件,这是国内首个开源的、深度适配中文语境的大模型安全护栏,同时发布国内首款大模型安全扫描器,构建起 " 四位一体 " 的大模型安全中枢。

AI 安全危机引爆

主流模型安全堪忧

2025 年全国两会期间,全国政协委员、奇安信董事长齐向东敲响 " 警钟 ":近九成本地部署 DeepSeek 的服务器在 " 裸奔 ",引爆了行业对 AI 安全危机的讨论。

早在今年春节,DeepSeek 出圈后不久就遭到了有组织的网络攻击。这波 " 职业黑客 " 的攻击规模之大、烈度之强,让中国安全界 " 群起而攻之 ",电信安全也深度参与 DeepSeek 安全防护中。今年 3 月,攻击 DeepSeek 的同一主力僵尸网络又直接将马斯克旗下的社交媒体 X 攻击到三次瘫痪。

大模型的安全问题究竟有什么共性?

根据中国电信 " 广目 " 测绘平台对全球大模型部署的实时感知显示,国内部署最广泛的模型是 DeepSeek-R1,国外部署最多的开源大模型是 Llama 3,但均面临类似的安全风险,比如,越狱攻击、大模型推理框架存在安全漏洞等。

电信安全曾对国内六款最热门的基础大模型做了完整扫描,结果发现,最高分只有 77 分,有的还低于 60 分。天翼安全科技有限公司总经理刘紫千表示,这说明国内的基础大模型在安全方面还有很大提升空间。

当我们问 AI 大模型一个问题时,它可能会给出不合规的答案。此外,本地化部署并不等于安全,服务器一旦被攻击,服务器上存储的客户隐私信息和商业机密就有可能被窃取。

这些逐渐暴露的风险,让大模型应用企业的安全意识快速回升,电信安全的 " 四位一体 " 大模型安全中枢也应运而生。天翼安全科技有限公司首席 AI 专家曹辉在接受《IT 时报》专访时表示,大模型安全风险来源于多方面,包括环境安全、数据安全、模型安全和应用安全等,所以安全防护也需要一个体系:预警、测评、防护、运营为一体。

对安全防护成本较低的中小企业来说,什么是大模型本地部署的安全底线?曹辉认为,部署大模型的中小企业既要关注模型内生安全,通过评测,选择相对安全的基础模型,大模型安全扫描器能够辅助开展相关工作;又要在大模型外侧部署专用的安全防护技术措施,见微大模型护栏不需要调整大模型系统,就像是给大模型上了一道防盗护栏,防护效果立竿见影。

国内首个开源大模型安全护栏

为蹒跚学步的大模型 " 加防护 "

《IT 时报》记者体验发现,输入同一个不当的问题,没有外加防护的大模型开始生成具体方法,但加了安全护栏,就能识别出问题中的风险,直接阻断输入,避免引导犯罪或产生舆论风险。

中国电信在 WAIC 2025 上开源的国内首个开源大模型安全护栏组件,不仅懂中文,提升中文提示词注入攻击防护、敏感信息泄露防护、生成内容合规检查等能力,还能提高模型抗 AI 攻击能力,而这是其他开源安全方案所不具备的。从这个层面来看,此次开源将有力支撑我国生成式 AI 技术在关键行业的安全可靠发展。

在全球主流护栏项目对比测试中,电信安全的大模型基础护栏 F1 得分(防得准也防得全),优于其他开源及商业化解决方案。

" 我们发现,现有的大模型安全数据集要么以英文为主,要么是以内容安全为主,对提示词的攻防设计相对不足。于是,我们构建了适用于中文环境且重点强调攻防特征为主的‘阡陌’大模型安全数据集。" 曹辉表示,在很大程度上," 见微 " 大模型护栏的成绩归功于 " 阡陌 " 大模型安全数据集长达两年的积累与建设。

近期,电信安全还构建了阡陌大模型安全子集,不仅涵盖了传统的内容安全数据,而且构建了提示词攻防特征数据集,研究了 GCC、AutoDAN 等 20 余种对抗提示词构建的算法,掌握了这些算法生成实例的特征,再用人工智能技术进行泛化,能够较准确地识别类似恶意行为。

DeepSeek 本地部署逐渐成为国内大模型应用的主流趋势,但随着安全问题的暴露,不少企业正急于完善安全防护措施,电信安全大模型护栏快速在各行各业落地,行业反响不错。

同时,电信安全决定开源大模型安全护栏组件,为蹒跚学步的国产大模型 " 加防护 "。" 一方面是快速帮企业消除安全短板;另一方面,我们希望更多研究者了解见微大模型护栏,共建高质量安全数据集,开展标准合作,共同培育中国人工智能安全新产业、新生态。"

用魔法打败魔法

" 以模护模 " 的范式突破

大模型的迭代周期为 3 个月左右,这一更新速度让安全界加紧了脚步,在 3 个月前举行的数字中国建设峰会智能云生态大会上,中国电信发布了一站式大模型安全能力平台,彼时,从基础设施到数据、内容、算法和应用一体的防护体系已经初见雏形,此次发布标志着其 AI 安全技术体系进一步完善。

" 用魔法打败魔法 ",中国电信构建了 " 四位一体 " 的大模型安全中枢——预警、测评、防护、运营,当前防护能力在国家技术测评中准确率与性能双项排名第一,实现了 " 以模护模 " 的安全防护范式突破。

在风险预警环节,电信安全推出的新型模型评测体系,兼容国内外主流大模型版本,在国际赛事中取得全球亚军;在技术监测方面,基于自主研发的 " 云堤•广目 ",构建覆盖全国的大模型数字地图,通过 11 类安全测试集中呈现风险;立体防护,顾名思义,是一套覆盖网络、数据、模型的多层动态防护体系,电信安全自研的 " 见微大模型护栏 " 效果优于主流开源方案;最后在日常运营环节,电信安全提供了一站式托管,其中 " 见微 " 安全大模型支持实时洞察高级威胁、精准预测攻击路径、自动闭环处置漏洞,颠覆传统的碎片化分析模式,告警识别准确率达 98%,提升整体安全响应效率 60% 以上,让安全防御从被动应对迈向主动免疫。

安全风险评估正在成为各省大模型备案的 " 标配 ",在某省大模型备案管理平台,电信安全正在协助建设 AI 安全检测中心,用 " 广目 " 对全省大模型进行全面测评,以及 " 全景式 " 安全体检,直观地呈现大模型的安全态势,保障大模型安全稳定地运行。

除了安全态势、护栏这两个核心能力外," 见微 " 系列大模型安全产品还打造了基于内网的大模型安全扫描器,形成输入可防、推理过程可检测、输出可控的模型及智能体应用防护体系,为行业提供精细化趋势研判支撑,实现秒级检测响应。

该工具专为政府及敏感单位的私有化部署场景设计,支持离线运行,兼容 RAM 平台,最低可在 512MB 内存、双核 CPU 的普通笔记本电脑上高效运行,而且具备高并发检测能力,可以在较短的时间完成全局扫描。用户仅需绑定设备,就能通过本地体检式扫描,快速识别提示词注入、模型越狱、违规内容生成等风险。检测完成后,系统会生成详细的 " 安全体检报告 ",清晰标注风险等级和防护能力。

除了 " 四位一体 " 的防护体系外,电信安全也在尝试将安全能力 " 外化 " 至其他领域。在 WAIC 2025 的电信展台上,中国电信云猎无人机智能侦测与反制系统成为 " 全场焦点 ",观众举 " 枪 "(智能反制设备)对准正在 " 黑飞 " 的无人机,将其 " 击落 "。该系统就是 AI 安全算法模型 " 外化 " 的表现之一,可以对无人机进行侦测、定位、识别、反制,用 AI 赋能低空安全,目前已在 16 个省份的重点区域落地应用,探测精准度可达 95% 以上。

" 内生外化,上天入地 ",大模型正快速从蹒跚学步到奔跑超越,在不断打破智能上限的同时,总要有人守住智慧的下限,建立全方位的防护体系,让科技不作恶。

排版/   季嘉颖

图片/   电信安全

来源/《IT 时报》公众号 vittimes

E   N   D

大家都在看

请加「星标」不错过我们

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

中国电信 ai 人工智能 开源 黑客
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论