腾讯科技 7小时前
微软全面升级Windows 11,语音成为核心交互方式
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

微软升级 Win11,推语音、视觉和任务执行三大 AI 功能。

10 月 17 日,微软宣称要让每一台 Windows 11 电脑都变成 " 真正的 AI PC"。通过全面升级 Copilot 功能,人机交互体验更自然,AI 的表现更聪明。

微软此次升级包含三大核心功能:

新的 "Hey, Copilot" 语音唤醒功能,用户可直接通过语音下达指令。

全球上线 Copilot Vision,让 AI 能够 " 看见 " 并理解屏幕上的内容,并提供帮助。

预览阶段的 Copilot Actions,支持 AI 助手直接在 PC 上执行任务。

这次重大升级标志着一项战略赌注:从单纯追求处理性能,转向打造智能化的对话式交互体验。微软希望让每一台 Windows 11 设备都成为这一新范式的载体,同时通过 Copilot 连接器整合 Gmail 等第三方服务。

01 无需动手,语音成为核心交互方式

能对话的电脑?微软官宣全面接入 Copilot,Windows 11 PC 化身 AI 助手中心

微软官方表示,正全力推动语音成为继键盘、鼠标之后的核心 PC 交互方式: 随着 "Hey, Copilot" 唤醒功能的全面开放,用户无需再点击图标,直接说出唤醒词即可开启与 AI 的对话。系统会以麦克风图标和提示音回应,确认用户处于聆听状态。结束对话同样简单:既可以说 " 再见 ",也可以直接停止说话。

微软认为,这一设计消除了传统语音助手的使用门槛,是微软将 AI 带给更广泛用户的关键举措。虽然这并非微软首次涉足语音交互领域,但该公司相信,基于现代 AI 技术打造的智能助手将能打破用户与电脑对话的心理障碍,实现以往未能达成的使用习惯变革。微软内部数据显示,使用语音与 Copilot 交互的频率是纯文本输入的两倍。

02 一个能 " 看懂 " 屏幕的 AI 助手,安全性能也高了

Windows 11 藏新招,任务栏新增 Copilot,喊一声召唤 AI 外挂

微软表示,正在为其 AI 未来图景添加一个关键组件:能够 " 看懂 " 屏幕的 Copilot Vision。这项功能现已全面上线,让 AI 首次具备了真正的视觉能力,它可以实时分析和理解用户屏幕上的内容,并在任何应用程序中提供精准的上下文帮助。

微软此前曾推出名为 Recall 的功能,旨在通过持续截屏记录用户操作,帮助用户回溯和找回过往内容。然而,这项功能自发布以来便陷入隐私争议。由于用户无法对截图内容进行精细筛选或控制,所有操作皆被默认记录,因此被认为 " 监视工具 "。

此次微软吸取了 Recall 的教训,Vision 采取了更谨慎的隐私保护策略。该功能默认关闭,用户需要在每个会话中主动点击独特的 " 眼镜 " 图标授权,才能启动屏幕共享。这种设计类似于 Teams 会议中的视图共享,确保用户对隐私的完全掌控。

一旦启用 Vision 功能,系统将具备实时分析屏幕内容的能力。该功能可提供软件操作的分步指引、协助排查系统问题,并能针对屏幕显示内容进行解答。

并且,Vision 应用范围已从早期的单一程序支持扩展为 " 桌面共享 " 模式,现在可以识别并理解用户跨多个应用程序窗口的完整操作流程。

微软 Copilot 团队这样描述其工作原理:" 当你共享桌面或特定窗口时,Copilot 就能看到你所看到的一切,并实时与你讨论其中的内容。"

这项技术的应用场景极其丰富:从为创意项目提供建议、帮助优化简历内容,到指导玩家掌握新游戏技巧等等。其 " 高光指引 " 功能尤为实用,能够直接在屏幕上用视觉方式标出需要点击的位置。

不过需要注意的是,Vision 目前仅具备 " 观察 " 和 " 建议 " 的能力,无法直接代表用户操作系统。执行操作的任务由专门的 Copilot Actions 负责。为了满足不同用户习惯,微软还在开发纯文本交互模式,让不喜欢语音的用户也能享受这项服务。

03 向 " 智能体 " 演进:Copilot Actions 开始接管 PC

微软推出 Copilot Actions 模式,让 AI 帮你搞定单调乏味工作

在本次更新中,面向本地文件的 Copilot Actions 功能具有革命性的意义,它让 AI 首次能够在用户 PC 上直接执行多步骤操作任务。这标志着 AI 正从被动的 " 助手 " 向主动的 " 智能体 " 演进,它不再只是响应用户指令,而是能够主动为用户完成工作。

这一突破让 Copilot 变成了微软所称的 " 通用智能体 "。现在的 Copilot 不仅能回答问题,更具备了实际操作能力,比如打开应用、输入文字、滚动页面,甚至执行复杂的多步骤任务。

用户只需用日常语言描述需求,比如 " 帮我整理上个月度假的照片 " 或 " 从这份 PDF 里提取所有数据 ",智能体就会尝试通过与桌面和网络应用的交互来完成任务。

当智能体在后台默默工作时,用户可以继续专注于其他事务。更重要的是,用户始终掌握着控制权,随时可以查看任务进度、审查智能体已执行的具体操作,或者在任意时刻中断任务、亲自接管。

04 当 Xbox 遇见 AI 游戏伙伴 升级娱乐体验

微软此次升级不仅限于办公或提高生产力领域,该公司也在探索 AI 如何融入娱乐体验。

例如在手持游戏设备领域,通过 ROG Xbox Ally 和 ROG Xbox Ally X,微软将两种看似不相干的技术——便携游戏与人工智能助手,巧妙地融合为一体。

除了能够快速访问来自 Xbox、PC Game Pass 及其他主流游戏商店的内容,用户现在还可以直接与 Copilot 对话。

只需长按设备上的 " 库 " 按钮,即可唤出微软的个人游戏助手—— Gaming Copilot。它能在游戏过程中实时提供攻略推荐、操作技巧与场景解读,而玩家无需退出当前游戏,也无需切换屏幕。

总而言之,微软正在将其 AI PC 定位为值得信赖的助手和伙伴。 微软执行副总裁尤素夫 · 梅赫迪 ( Yusuf Mehdi ) 表示:" 我们希望每位用户都能体验到,拥有一台不仅仅是工具,而是真正伙伴的 PC 意味着什么。"

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

微软 ai vision gmail 语音助手
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论