数智前线 前天
一直与微软Office掰手腕的金山办公,能否靠AI领先?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

WPS 灵犀 =Gemini+Chrome+ 微软 Office。

‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

文|徐鑫 周路平

‍‍‍‍‍‍

编|任晓渔

办公提效是 AI 大模型出现后应用最广、也是效果最显著的场景。在今年 5 月美国机构开展的一次大规模调研中,写作辅助和 PPT 制作都是排在前列的应用。而 WPS 作为国内最老牌的办公套件,其在 AI 办公上的进展一直备受外界关注。

7 月 27 日,金山办公发布了原生 Office 办公智能体 "WPS 灵犀 ",用户只需通过自然语言、多轮对话即可完成文档创作、演示文稿生成及语音助手等功能,全程无需复杂操作和外部跳转,而且可以在右侧的对话框中,与 AI 边聊边改。

同时,它还能保证 PPT 生成的效果,顺畅完成二次修改编排,贴合现实使用场景的体验,令不少用户感到惊喜。" 不再是辅助的工具,而是正在变成了一个可控的智能助理。" 有人如此形容灵犀的体验。

基于用户现实的需求,将 AI 能力与文档办公组件深度融合,灵犀也引领办公领域走向智能体时代。

办公智能体的 "Aha moment"

内容创作已经是 AI 最基础的功能,不管是 AI 办公软件,还是各类通用的 AI 应用都具备创作生成的能力,不过此次 WPS 灵犀的发布,却在强调 " 边聊边改 ",更符合真实办公场景体验。

到底实际效果如何,我们也做了上手体验。

首先演示文稿生成场景。我给灵犀下了一个指示:以深度学习技术的发展历程为主题,制作一份演讲时长 30 分钟左右的演讲稿,里面要有行业内的前沿动态和案例。

AI 智能体在接收指令后快速对任务进行了拆解。可以先看一下它的深度思考拆解过程。

它给出的大纲条理清晰,内容丰富,完整地呈现了深度学习技术的发展阶段。而且开头、结尾以及段落之间的衔接,有很多口语化的表达,符合演讲者的身份,自然鲜活。

既然它说可以边聊边改,我也挑了一下它的毛病,要求它优化致谢部分的表达方式。

WPS 灵犀理解了我的需求,并且精准定位到了致谢的位置。它还给出了修改的说明,认为可以补充相关数据,增加严谨性。

提出了这些修改意见后,在目录下方有一个挑选 PPT 模板选项,WPS 内置了丰富且精美的模版库。

两分钟后,WPS 灵犀就生成了数十页的 PPT,效果令人惊喜。这份 PPT 不仅风格统一、排版精美,而且还插入了各种图标和图片,甚至这些图片都是根据演讲内容生成,并非是毫无关联的配图。

生成好了 PPT 之后,作为一个挑剔的合作者,我再次提出要求。能否跳回大纲部分,补充人机协同系统构建案例。WPS 灵犀非常有耐心,它首先回溯了一遍任务,然后上网搜寻了信息,之后再次回到大纲修改了大纲内容。

大纲修改完成后点击就能生成 PPT。到具体的 PPT 页面里,如果有不满意需要调整的地方,侧边栏的 AI 智能体又能出马帮忙。

比如,在某一页里无论是内容、条目数量还是格式等有问题,都能动态调整。

甚至,WPS 灵犀还可以根据生成好的 PPT,提供演讲脚本的生成,并配上演讲者的声音和动画,将其制作成演讲视频。

生成的文稿有两种模式。一种是可以嵌入到演示文稿的备注中,在演讲者模式里直接可以成为演讲时的提示词。也可以导出为文档,直接对着文稿介绍。

除了 AI 生成演示文稿和 PPT,WPS 灵犀在合同文书场景里的能力也令人印象深刻。

我最近租房,需要一份租房合同。在使用 WPS 灵犀之前,我发现市面上有很多 AI 助手虽然可以生成合同,但大部分都不能直接生成 word,需要自己复制粘贴到 word。体验割裂不说,合同本身需要有排版格式,复制到 word 里格式往往一团糟,很难上手即用。

而 WPS 灵犀直接给了我一份带格式的合同,调格式的烦恼直接没有了。

这波体验下来最直观的感受是,用起来更有确定性和更可控。其亮点如下:第一,它用聊天对话的方式就把内容定了。第二,它不追求一锤子端到端搞一个看起来酷炫的东西,而是务实地认为,办公场景需要通过多轮自然语言对话,逐步让 AI 给用户交付一个更符合用户需求的东西。第三,它也不只是生成内容,还能交付有确定性的格式和呈现效果。

" 现实生活中我们就是这么工作的。当你有一个真正的助理,最高效的沟通方式一定是你一边对着文档,一边告诉他你需要什么。"WPS 助理总裁田然在 WAIC 演讲中说。

" 边聊边改 ",技术实现起来并不容易

相比外界的一句话生成文本或者演示文稿,WPS 灵犀的新颖之处是边聊边改,实时同步结果。这个差异能看到 WPS 在产品理念层面,选择向贴近用户使用场景,更务实的方向演进。

" 一句话生成一个完整内容,这件事并不符合日常用户的交互和使用习惯。人的创作过程,本质也是一个非线性的逐步成形,螺旋逼近成品的过程。"WPS AI PPT 产品负责人陆炜俊说。

而除了产品理念贴合用户需求之外,数智前线与 WPS 产品技术团队的交流同时得知,颇刷大众好感的 " 边聊边改 " 实现起来并不如看起来那么容易。

资深人士介绍,市面上此前一键生成 PPT 的模式,本质上是把非结构的内容变成结构化的大纲,后面的动作就是套模版。

而 WPS 灵犀通过与用户的多轮对话来理解用户,在大纲环节确保符合用户需求。同时,这个环节相比其他一键生成模式,技术突变点在于让大脑能够行动的脚手架上,有了脚手架让大纲可以做增删改查。

这里面,大模型推理能力的升级非常关键。基模能力如果不强,没有那么强的指令遵从能力,泛化时可能就会出现幻觉,模型就容易乱编格式,编完再渲染回文档或者演示文件,效果会很糟糕。

而随着智能中枢大脑的推理能力变强,给能理解更复杂语义的大脑中枢提供一个可以增删改查的手脚,生成大纲这一步就多了一个控制节点。WPS 产品团队认为,大纲编辑器是他们给行业提供的一个基建。

" 它看起来像一个文档,但它不是文档,也不完全是 markdown,而是我们人为定义的正文节点的一个编辑器。我们让大模型认识了这个大纲编辑器,围绕着大纲的这个增删改查的脚手架才能调动成功。" 陆炜俊说。

在体验中,我们也发现,围绕着大纲内容的调整,WPS 灵犀已经有非常精准的定位能力。比如我想要它调整致谢相关表达时,大模型能理解整个大纲里哪个部分是致谢,其他部分的大纲就不发生变化。

而整个 PPT 制作过程有三层,在内容之外,还有排版和样式。目前排版样式需要在生成的 PPT 文件内调整。这些调整过程目前也用到了 AI 能力,比如三个信息点增加成四点,点击一个按钮版式上会自动变成能容纳四层信息的样式,用户无需自己排版对齐美化。

但当下它还不是在灵犀里用聊的方式完成的。" 现在还没法在全篇文档里来改细节格式,围绕着格式版式有 1 万个 API,排列组合下来它是一个天文数字。"

WPS 产品团队介绍,这是他们接下来努力的方向。要往这方向发展,有不小的难度。

这里面不止是要把组件的各种格式能力打碎,能被原子化地调度。更重要的是要让 AI 调用 API 的时候既能发挥 AI 的创造性,又能严谨遵循格式要求。田然认为,组件有那么多的 API,尤其是表格,复杂度极其高,以什么样子的方式又得让 AI 能用到,同时又不会把 AI 去用废了。两边的都需要大量的工程工作。

据了解,目前 WPS 产品团队已经构建了一套新的更适合 AI 原生的 API,它作为一种中间协议,在模型和编辑器中双向沟通,发挥模型的创造性,同时也确保产出结果在格式等层面的可控性。

不过 WPS 认为,他们来做这件事也有固有的优势。与市面上的其他产品相比,WPS 拥有海量的用户,也围绕着 Office 做了几十年的技术积累。今年年初,金山办公披露,WPS Office PC 版的日活设备数已经过亿。这不仅能让他们更熟悉用户的需求,也能从产品层面更好地满足需求。

" 能够用好 AI,还能够理解 office,这就是我们跟别人不一样的地方。office 有 1 万个 API,我们接下来怎么把这 1 万个 API 能够封装为让 AI 能调度,这是我们幸福的烦恼。" 陆炜俊说。

从与微软掰手腕到引领半个身位

WPS 最早诞生于 1988 年,比微软 Office 先开启中文文字处理时代。双方多年来一直在交锋。不过,微软 Office 早年凭借兼用协议和系统捆绑销售的方式抢占了绝大部分市场,也因此通过 Office 办公三件套定义了文档的格式、成为了行业标准。

而这些年,WPS 通过布局移动端,持续在兼容性和生态上下功夫,也逐渐夺回了本土市场。2025 年一季报的数据显示,WPS Office 全球月活设备数达到 6.47 亿。

进入 AI 时代,新的竞争格局仍在持续变化。在 WPS AI 1.0 时代,外界依稀还能看到微软的影子。但随着 WPS AI 3.0 的原生 Office 智能体灵犀的发布,金山办公在 PPT 生成和文档生成等方面的体验已经走在了前列,成为 AI 办公领域的先锋者。

在金山办公助理总裁田然看来,微软 Copilot 的产品形态,属于是 WPS AI 3.0 之前的版本。

一位金山办公内部人士告诉数智前线,金山办公 WPS 与微软 Office 在 AI 上做的事情有相似之处,都是给用户提供更加智能化的操作,但两者的整体技术路线其实不完全相同,微软现有的产品更偏向基于现有功能,然后加上 AI 能力。

而金山办公会从更加底层,把程序最底层的 API 暴露给模型,然后模型用代码的方式去生成,这更能保证 AI 生成的准确性和覆盖度," 但这样的技术难度曲线就会比较陡峭 "。

在田然看来,WPS 灵犀做的事情和 Cursor 的逻辑非常相似," 只不过 Cursor 是给程序员做,我们是给所有的文档工作者做。"

程序员写代码需要在 IDE 的环境中实现,而 Cursor 做的最核心的事情是把大模型的能力与 vscode 编辑器的能力做了深度融合。这种能在真正的编译运行环境实际使用的代码与早期 AI 生成的代码是两回事。

WPS 灵犀则是在 Word 或者 PPT 的编辑器里面来实现交互过程,尝试推动 AI 和办公软件的深度融合," 不是把软件的 10000 个 API 教给 AI,而是针对场景做 AI 和软件的双向改造,软件为 AI 设计专有能力,同时教会 AI 跟软件深度交流,最终依靠用户、软件、AI 之间多轮交流,输出真正可用的内容。"

田然将 WPS 灵犀形容为融合了 Gemini、Chrome 和微软的能力,做到了把用户真正想要的文档形式跟 AI 之间的交互," 这个市场上今天仅此一家 "。

除了技术路线上的不同,WPS 之所以能在 AI 体验上做出惊喜,也跟金山办公一直以用户需求为中心的务实心态有很大关系。

金山办公反复强调的一点是,不会去发布看起来酷炫但落不了地的功能,而是基于海量用户的反馈去解决已经存在的痛点和需求。相反,市面上很多企业做产品的思路是先做一个酷炫的 Demo,推向市场,进而拿到融资。

这种务实也体现在金山办公对自身的定位上。金山办公从一开始就明确不做基础大模型,而是基于业内最优秀的大模型,集中精力放在 AI 的应用落地。

今年初,金山办公首次发布了五年战略,金山办公决定将适当放宽对 WPS Office 的收入增长目标,转而把用户体验置于更优先的位置,同时将 "WPS AI 做成办公领域的 AI 引领者 "。而 WPS 灵犀也在刚刚结束的 2025 世界人工智能大会上,获评为 " 镇馆之宝 "。

回顾金山办公的 37 年发展历程,它仿佛一场穿越重重困难的长征。但愿意花笨功夫,愿意根据用户真实需求去踏踏实实做产品的金山办公最终生存下来,且一步步走向壮大。WPS 这一次推出原生 Office 智能体灵犀,是 WPS 在 AI 的大时代,成为 AI 办公先锋者的关键。

© 本文为数智前线(szqx1991)原创内容

进群、转载或商务合作联系后台

文章精选

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai wps 金山办公 效果 微软
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论