全天候科技 7小时前
金山办公朱熠锷:从“看到”到“掌握”:AI应用进入“知识增强生成”时代
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

12 月 20 日,在华尔街见闻和中欧国际工商学院联合主办的「Alpha 峰会」上,金山办公助理总裁、资深技术专家朱熠锷发表题为《WPS AI: 迈向更高质量的知识增强生成》的演讲。

他表示,当前 AI 应用的核心挑战已经从模型能力的竞争,转向如何高效利用企业私域数据。模型能力的趋同,意味着其本身难以形成垄断优势。

他强调,真正决定 AI 应用价值的关键,在于将企业内大量复杂、非结构化的文档数据,转化为高质量、可被模型理解的知识资产。传统 RAG 面临 " 文档不等于知识 " 以及 " 语义相似不等于逻辑相关 " 的根本局限,因此必须推动技术范式从 " 以模型为中心 " 升级为 " 以数据 / 知识为中心 "。

他强调,未来的路径是发展 "KAG(Knowledge Augmented Generation,知识增强生成)"。这要求企业像管理数据一样,系统性地对知识进行治理、建模与应用。具体而言,需要通过 VLM、知识图谱等技术,融合多模态、多结构化的知识,并构建 " 数据湖 " 与 " 知识湖 " 双湖并重的架构。最终目标是让 AI 真正 " 掌握 " 而非仅仅 " 看到 " 企业知识,从而在专业领域问答、智能写作与合规创作等场景中发挥可靠价值,完成从数字化到智能化的关键跨越。

以下为演讲精彩观点:

企业 AI 应用正从 " 以模型为中心 " 转向 " 以数据为中心 "。数据质量成为决定 AI 应用效果的关键。WPS AI 以知识增强生成(Knowledge-Augmented Generation)为目标,帮助大模型真正 " 掌握 " 企业的知识资产。

要像管理数据一样管理知识。将数据与知识转化为 AI 可用的资产,是企业从数字化迈向智能化的基石。DATA 2.0 时代,企业要像管理数据一样管理知识,WPS 365 通过知识建模、知识治理与多模态融合,为企业构建专属的 " 企业大脑 "。

高质量的输出,必须始于高质量的输入。如果输入的是混乱、冲突的原始数据,无论模型多强大,产出的结果都不可靠。因此,知识治理是 AI 在专业领域落地的基石,其重要性将超越算法优化本身。

AI 的专业化应用是一场 " 知识工程 ",而非简单的技术集成。从合规报告撰写到精准信息抽取,其本质都是将专业领域知识系统化、结构化的过程。谁能率先完成自身知识资产的升级,谁就能在 AI 时代建立真正的竞争优势。

真正的智能不是 " 看到 " 文档,而是 " 理解 " 逻辑。当前主流的 AI 应用(如 RAG)因 " 语义相似不等于逻辑相关 " 而遭遇瓶颈。真正的突破在于融合知识图谱、业务规则等多源知识,让 AI 能进行逻辑推理与精准回答,从而解锁专业场景的价值。

以下是华尔街见闻整理的精华内容:

大模型之后,真正的瓶颈是什么?

当前一个关键的共识是,前沿大模型的综合智能在知识储备与逻辑理解上已超越普通员工,且模型能力趋同,难以垄断。那么,核心问题便转向了:大模型如何在实际应用中发挥真正的价值?

我们的答案是:必须与外部数据,尤其是企业私域数据深度结合。但以 " 文档 " 形式存在的数据本身不等于 " 知识 ",是由于企业海量的文档(文字、表格、PDF 等)存在格式复杂、组织混乱、内容矛盾等 " 先天不足 "。一份文档中,未休年假折算比例可能是 200%,另一份却是 300%;一份法规要求存储六个月数据,另一份则说只保留必要数据。这些冲突不解决,AI 的输出就不可靠。

更深刻的挑战在于主流技术范式。当前广泛应用的 RAG(检索增强生成)技术,其核心是 " 向量相似度检索 "。这带来了一个根本性局限:语义相似,不等于逻辑相关。例如,问 " 笔记本电脑开不了机怎么办 ",系统可能召回一篇详细介绍 "MacBook Pro 14 寸 " 规格的文档(语义相似),却错过了真正解决问题但未提及 " 笔记本 " 三个字的故障排查指南(逻辑相关)。这导致许多 AI 应用 " 出 Demo 惊艳,上生产困难 "。

从 RAG 到 KAG,构建 " 知识增强生成 " 新范式

为了突破这些瓶颈,我们提出必须从 RAG 演进到 KAG(Knowledge Augmented Generation,知识增强生成)。这不是简单的优化,而是一次范式转移。其核心观点有两个:

一是高质量输入才有高质量输出。知识必须先经过治理,解决冲突、补齐缺失、建立结构。

二是必须系统性融合多模态、多结构的知识资产。不能只检索文档,还要融合企业已有的知识图谱、结构化标签、流程 SOP 等,为 AI 生成提供高质量输入。

基于此,我们设计了一个双层架构。底层是 " 知识治理层 ",负责文档解析、知识抽取、图谱构建与质量监控;上层是 " 知识应用层 ",它多源融合检索引擎、动态排序模块、上下文工程体系为核心组件,构建能够赋能各类专业场景的知识基座。

在四个关键场景中落地 KAG

基于 KAG 架构,我们研发了智能文档库产品,并聚焦于四个核心场景:

第一,知识治理。 我们通过自动化的知识抽取与图谱构建,帮助客户发现文档库中的重复内容、逻辑冲突和知识缺失。例如,系统可以自动标出关于年假折算比例的两个冲突版本,或指出一个 "IT 支持 " 知识库还缺少 " 打印机驱动安装 " 的关键章节,辅助管理员进行决策和优化。

第二,专业智能问答。在融合了私域文档图谱与行业法规、SOP 等结构化知识后,我们的问答系统能处理复杂的专业查询。例如,用户可以问:" 在浙江省,生产某种特定粒径的原料药,是否可以使用 X 成分?请仅依据 2025 年的规定。" 系统能精准解析地点、成分、年份等多个约束条件,并给出精确答案。

第三,复杂文档的智能抽取。我们针对医疗报告、合同、发票中常见的复杂表格、复选框、手写体等进行了专项优化。一家医药客户利用此功能,将药物不良反应报告的邮件附件自动解析、抽取关键字段,并回填至客户的药物管理系统,将原本人工处理需数小时的工作缩短到几分钟。

第四,专业领域的智能写作。这不同于写请假条,而是撰写有严格格式与数据引用精准要求的行业报告(如临床研究报告 CSR)。我们通过两个智能体(Agent)协同工作:一个负责根据范例和法规生成包含大纲、数据需求的 " 智能模板 ";另一个则依据模板,从海量实验数据中精准定位、无损引用所需的数据和表格,最终生成格式合规、数据准确的专业报告,将撰写周期从数周大幅缩短。

像管理数据一样管理知识

最后,我想做一个总结。从 RAG 到 Graph RAG 再到 KAG,是一个从 " 让大模型看到文档 ",到 " 理解文档间逻辑 ",再到 " 真正掌握企业知识资产 " 的升级。

我们认为,在智能化时代,企业需要构建 " 数据湖 " 与 " 知识湖 " 双湖并重 的新架构。未来,企业不仅要积累原始数据,更要像过去管理数据一样,系统地进行知识运营、知识建模和知识治理。这,将是企业从数字化迈向智能化的关键基石,也是 AI 在专业领域发挥真正提效作用的必经之路。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai wps 金山办公 效果
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论