爱范儿 3小时前
HDC 2026 深度解构:鸿蒙全面向 Agent 架构演进,小艺做了这三件事
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

对着手机说一句「我下午要去会展中心参加线下会议,需要提前   20   分钟到,帮我看下什么时候出发,约好车提醒我」,接下来发生的事情很快:小艺查了日程里的会议时间和地点,调用地图看实时路况算出发时间,预约好车并设了闹钟提醒。

一个任务,三个应用的多个服务,只用一句话调度。

——这是在华为开发者大会   HDC 2026   上展示的一个使用小艺的日常场景。

表面看起来是一次语音交互的升级,但底下的变化大有文章:这个任务跨了日程、地图、时钟多个独立应用,过去用户需要手动操作分别打开它们,挨个翻页找到具体的服务;但现在小艺把整条链路串起来了,用户只负责说出自己要什么就行了。

这一新的手机   AI Agent   交互体验的背后,是   HarmonyOS   向   Agent   架构的一次整体演进。基于全新升级的鸿蒙智能体框架 2.0,小艺跟鸿蒙系统深度融合,成为系统智慧大脑,变成长在操作系统里的智能体,向着最强系统智能体的方向演进。

新的时代,新的入口

过去二十年,移动互联网的统一操作逻辑,建立在用户→找应用→找服务的路径上:不同应用提供不同服务,用户主动打开需要的应用,再去应用里找某个具体的服务。

我们都对这条运转良好的逻辑习以为常,但实际上我们的手机里平均安装七八十个   App,日均使用只有   10   个左右。根据第三方分析平台数据,对于一个典型的智能手机用户,62%   的   App   一个月都不会打开一次。

这些应用不是不好用,是使用场景窄,用完就搁置了。它们的服务价值还在,但需要新的调用方式。

Agent   时代正在成形的路径是「意图即服务」:用户提需求→   Agent   交付。具体来说,Agent   会判断、调度、执行,精准理解需求并分发服务。用户不需要知道背后调用了哪些   Agent/Skill,只需要知道需求被满足即可。

在新的移动 /AI Agent   时代,入口的性质也发生了改变。过去,应用争夺的是「信息入口」,决定用户看到什么;Agent   时代争的是「行动入口」,决定替用户做什么。

Agent   是比搜索框更深、更高频的下一个默认入口,谁握住它,谁就掌握了下一代移动互联网的分发权。这也是移动互联网时代的平台厂商们感到紧张又兴奋的原因。

前不久,Google 将 Android   的定义从「操作系统」改成了「智慧系统」 ( intelligence system ) 。Gartner   预测到今年底   40%   的企业应用会嵌入   AI Agent,去年不到   5%。

起初,苹果通过   App Intents   框架让开发者给   Siri   暴露功能接口,不过被   Siri   自身能力所牵制。不过上周   WWDC   上苹果也算是交出了新的答卷,Siri   现在终于有了独立   App   形态,并且其理解用户意图、操作手机的能力,也有了很大提升。很明显能看到的是,苹果也在用一系列新的   Apple   智能以及   Siri AI   能力,吸引生态开发者。

Google   更激进:Gemini Intelligence   直接嵌入   Android 17   作为系统级   Agent,AppFunctions API   让应用暴露功能接口,没   API   时用   GUI   自动化兜底。不过目前接入的应用只有二三十个。

而在国内,我们看到目前最为前沿的进展,并没有意外,发生在华为的身上。

HarmonyOS   的「元服务」架构天然把服务拆成轻量、免安装、跨设备可调用的模块,Agent   浪潮则恰好提供了现成管道。华为在这条路上已经走了三步:2024   年搭建鸿蒙   AI   基础能力和框架,2025   年发布   HMAF   推动应用级   Agent   化,到今年的目标是整个操作系统的   Agent   化。

HDC 2026   上公布的三件事,就是这第三步的具体路径。

第一件事:系统应用全面   Skill   化,让系统成为小艺的感官与手脚

要能真正会干活,小艺首先需要调动更多系统能力。感知、数据、设备控制,这几类能力过去锁在系统底层。华为的做法直截了当:全部   Skill   化,交给小艺统一调度。

HDC 2026   公布的数字:系统应用全面 Skill 化,2100   多项系统能力可被小艺调用,200   多项系统级数据接入小艺的上下文。备忘录、日历、图库、蓝牙、联系人、文件管理等系统应用的能力全在里面。小艺因此能在用户的授权下调用摄像头、读懂屏幕内容、感知场景状态、调度多设备协同。整个   HarmonyOS   的系统能力成了小艺随手可用的工具箱,而且用户也不需要告诉小艺「先打开这个再打开那个」。

有两个场景很适合用来展现小艺获得系统级能力加持后的   Agent   使用体验:

对小艺说「我报名了楚雄半马,帮我制定个恢复训练计划」。小艺的反应链条是这样的:先拆解意图,查询比赛相关信息,判断用户处于停训或恢复期,需要温和的重启方案;再调用日程、运动健康、睡眠等系统数据;然后协调网页搜索、运动健康   Coach、运动健康   Health   等   Skills   协同工作;最后综合评估,输出定制训练计划并写入日历。

再来看跨端协同能力:比如你不在鸿蒙电脑前,但需要电脑上的一些关键文件,可以跟小艺说:「把电脑上跟傅里叶实验有关的所有材料打包发到我手机上,并且准备一份材料清单。」即便电脑是合盖待机状态,甚至都不确定文件名称具体叫什么,小艺也能帮你完成。具体步骤是:首先手机小艺就会联动   PC   小艺把电脑上近期保存的相关资料找出来并把清单发给我们确认,确认哪些是我们所需的相关资料后,PC   小艺调用文档管理   Skill   把文件打包成压缩包发送到手机小艺上,完成后跨设备通知提醒。

而且,小艺使用过程中,正在调用哪个工具、执行到哪一步,对于用户都是透明的,可见可控。

这些场景,涉及到了当下非常热门的行业概念:A2A   和   Skill。

A2A ( agent-to-agent )   概念去年   4   月由   Google   和   IBM   首次提出,随后交给   Linux   基金会形成社区驱动的开源国际标准,目前得到全球超过   150   个组织的参与支持。华为此前发布的   AI   终端白皮书、鸿蒙智能体框架白皮书中都强调过系统级端 / 云智能体协同协议,是较早把   A2A   协作落地为系统级协议的厂商之一。

在传统的   AI   交互链条中,人对   AI   说话,AI   再去执行。但   A2A   的不同之处,在于   Agent   之间可以直接对话协作,而这需要一个聪明的「管理者」「协调者」。

在刚才的半马场景中,小艺拆解了任务,随后调度「运动健康」「日程」「搜索」等多个子   Agent   和   Skills,让它们通过鸿蒙智能体框架   ( Harmony Agent Framework, HMAF )   协议自行协商和交换数据,并行推进任务。

除了自主规划、协调各种系统能力或生态伙伴能力   Skills   和   A2A   去执行任务外,小艺还能做一件更有意思的事:帮用户「造工具」。

对小艺说「做个儿童学英语的小工具,支持拍物品学单词,拍照识别物品后展示英文、音标、释义和发音,卡片可以加到单词本里」。小艺通过调用「码上飞」的文生代码能力以及结合系统的相机、TTS(文字转语音)播报能力,可以快速生成一个可交互的学习工具,不用下载应用,更不用自己写一行代码,说完就能用。

这比让小艺帮你订机票或做训练计划更往前走了一步:用户不再只是任务的发起者,更是工具的创造者。

第二件事:AI   能力开放,让开发者灵活高效接入

系统应用   Skill   化和   A2A   的支持,给小艺打好了地基。但一个系统级   Agent   如果只调用自家服务,天花板很快就到了。第二件事要解决的问题是:把生态接进来。

HDC 2026   上,小艺开放平台也进行了升级,开放了多种接入方式:Agent、Skill、MCP、意图框架等,三方应用可以选最适合自己的深度接入小艺的调度体系。目前已有   500   多个精选伙伴 Skills   上线,2000   多个鸿蒙智能体上架。例如,东方财富的妙想   Skill   已经能联动联网搜索   Skill,用自然语言完成自定义条件选股。

在更底层,鸿蒙智能累计开放了   20   多项   AI   子系统能力,日调用量   36.8   亿次。诸如信息摘要、卡证识别、活体检测、图像超分等能力,已被京东金融、铁路   12306、知乎等应用接入,开发者不用自建模型,就可以在应用里调用系统级   AI。

为了让接入足够顺畅,鸿蒙智能体框架做了几件具体的事情:

A2A   协议升级后支持端侧直连,头部伙伴的   Agent   可以在设备本地完成协作,腾讯视频已经通过这种方式接入,用户可以直接让小艺设置倍速、问剧情,不用跳出当前界面;A2UI   协议让   Skill   不用预先定义界面,Agent   根据用户指令的复杂度动态生成   UI,同一个   Skill   在手机、平板、车机上都能渲染;Skill   上架打通了华为账号鉴权,配合自然语言开发工具,让规模、能力不同的开发者团队都能快速接入。

对于用户来说,只需说出需求就能得到结果,小艺可以调用各种   Skills/Agents   来为用户提供更极致的智慧体验。

这套逻辑叫「意图即服务」。用户说出需求,系统理解意图后直接匹配能完成这件事的   Agent   或   Skill,跳过「打开   App- 找服务」这个步骤。

比如周末三五好友来家里聚餐,对小艺说「今天来三个好哥们,帮我规划个菜单」。小艺先根据人数和口味偏好生成菜单,列出每道菜需要的食材和分量,然后调用叮咚买菜的   Agent,把食材清单一键加入购物车,用户确认后直接下单。

从「想吃什么」到「食材到家」,一句话串起了菜单规划、食材匹配、生鲜电商三个环节。用户没有打开任何一个   App。

对开发者,分发逻辑从根本上变了,和过去的应用商城截然不同。过去是「用户找   App」,数万个应用争排名、竞价推荐位。

「意图即服务」的逻辑是「用户说需求,系统找服务」,只要服务做得好,在   Agent/Skill   化适配上足够顺畅,小艺会在用户需求匹配的时候主动精准调用开发者的服务。

华为去年启动的天工计划投入   10   亿元,目标是孵化超   10000   个   AI 元服务、1000   多种意图框架以及   MCP,和   5000   多个   Agent ——本质上是在帮开发者降低接入门槛。

几种接入方式中,MCP ( Model Context Protocol )   是   Anthropic 2024   年提出的   Agent   与工具通信标准,目前已是行业事实标准。鸿蒙兼容   MCP,等于给外部   AI   生态开了一扇门:不管开发者在哪个大模型生态里,只要遵守这个协议,就能进入小艺的调度体系。

最后,当   Agent   可以跨应用调度服务、读取系统数据,安全就不再是附加题。

华为在   HDC 2026   同期发布了《鸿蒙智能安全白皮书》,把安全架构摆到了和   Agent   能力同等的位置。

小艺采用   HPIC(HarmonyOS   个人智能计算系统)架构,坚持本地优先、数据最小化、用户可控。需要云端算力时,AI   推理在用户专属的机密环境中运行,通过   OHTTP   协议和端云协同加密实现用户身份三重匿名盲化,系统管理员也无法查看用户明文数据。

在应用层面,涉及转账、支付等操作时,系统会阻断自动化流程,必须由用户手动完成;证件、工作文件等敏感资料在设备本地流转,云端只接收处理后的结果。

HPIC   已通过中国泰尔实验室三大安全检验,达到行业高标准的增强级要求。不仅如此,小艺   Claw   成为首个获信通院国家级认证的终端厂商   Claw   类智能体。

第三件事:业界优质大模型引入,给小艺一个可升级的大脑

第三件事关乎小艺的「智力」来源。

小艺要聪明,需要聪明的大脑。有趣的是,华为果断地选择不押注单一模型。

大模型的世界变化太快,半年前的最优解半年后可能就不是了。华为的判断很务实:与其押注一个具体的模型,不如建一套「万能插座」式的模型接入架构,让   Pangu、DeepSeek   等大模型能灵活对接和调用。谁在哪个场景做得最好,小艺就用谁。

正因为这种灵活性,小艺的使用体验变得愈发聪明。基于   Agentic   自演进架构,让小艺可以自主思考、规划、调度。效果就是,用户往往不需要告诉小艺一个复杂任务该怎么做,小艺自己思考就可以做得很好。

在实际使用中,模型的灵活对接带来的差异很明显。当你对小艺说「帮我写一封英文商务邮件」,小艺判断这是多语言生成任务,路由到英文写作能力更强的模型;当你说「分析一下我上个月的运动数据,给个改善建议」,任务涉及结构化数据理解和个性化推理,框架可能切换到另一个更擅长此类推理的模型。两个请求,两条路径,用户感知到的只有「小艺都办好了」。

这个选择和   Apple   在   Core AI   框架中的多模型策略有相似之处,但执行深度有区别。苹果在   Siri   层面开放了多模型后端,更多是提供了选择权,并且直接交给开发者,但并无更多协调层面的已知工作。而华为的更多工作,是在操作系统底层建了一套模型调度框架,覆盖从意图理解到任务执行的全链路,且模型的切换对用户透明。

模型调度解决了「会不会做」,但还有一个同样关键的问题:小艺记不记得你是谁。

就在两周前,OpenAI   上线了   Dreaming V3,将   ChatGPT   的记忆架构整个重写:系统在后台自动跨所有历史对话合成用户画像,不需要手动告诉它「请记住」,并且过时的信息还会自动更新。

行业方向越来越清楚:模型再强,如果每次对话都如初见,体验的上限很低。

在 HDC 2026   早餐会的分享交流中,小艺相关负责人介绍了小艺针对「如何记住用户」所做的努力。

小艺全新升级了记忆体系:瞬时记忆处理单次推理,短时记忆覆盖单个对话窗口,长时记忆沉淀用户的指令偏好和隐性习惯,全时记忆做伴随态的持续积累,最终汇成全局动态画像。

和纯对话型 AI 不同,小艺的记忆源不只是聊天记录——日历、运动健康、消费记录、图库这些系统级数据全在里面。华为的定位也很明确:这套记忆体系叫「鸿蒙记忆」,是 AI OS 的底座能力,不是小艺一个应用的私有功能。系统级数据、全场景设备、端侧隐私处理,这个组合是鸿蒙在记忆这一层的差异化位置。

举个例子:每年体检后我们都习惯性地把报告下载下来存在本地,但要回溯之前的某项身体数据来对比就会比较麻烦。当小艺帮你记住后,唤起小艺问一句「我这三年甘油三酯什么趋势」,小艺能跨时间调取数据,给出变化曲线,还能结合健康相关的智能体提供咨询服务。

记忆不回到场景里,就只是存档。回到服务里,才变成能力。

这一能力不局限于某个 App,而是跨应用的,系统根据记忆中沉淀的意图模式来判断什么时候弹出。这条「记忆沉淀→回到服务」的链路,把前面讲的「意图即服务」从被动响应推向了主动预判。

正如前面提到,一个体验优秀的 Agent 产品,需要两样东西成立:优秀的模型和优秀的脚手架。两者互相成就。好的智能体框架能让优秀的 Agentic 模型被最大化利用,带来更好的体验。对用户来说,小艺让人觉得「聪明懂我」「办成事」的秘诀,在于一套让好模型为它所用、让记忆越积越厚的工程体系。

当操作系统成为   Agent

2008   年   App Store   上线,沿着「用户下载   App、App   提供服务」这条路径,到今天已经   18   年,生长出了万亿美元级的分发和商业生态。

但现在,所有平台厂商都在做同一件事:把入口从   App   迁移到   Agent,带给用户更好的   AI   体验,并给开发者带来新的机会。迁移的速度,和生态扩张的速度,很可能比上一次更快。一个参照:MCP   从发布到成为行业事实标准用了半年,A2A   从提出到超过   150   个组织加入只用了一年多。移动互联网早期,一个开发范式从提出到普及至少三五年。

华为在   HDC 2026   上让小艺深度融入操作系统底层,也是沿着这条新路径做的一次前瞻尝试。

但更值得思考的,是这条路的终点指向哪里?当一个   Agent   沉淀了你的日程、健康数据、消费偏好、工作习惯,它和你的关系已经不是「工具」可以概括的了。它在变成一个了解你的协作者,不需要每次从头了解你是谁、偏好什么、上次做到了哪里,有什么问题需要改进——它都记得。

至于应用,当然不会就此消失,但新的入口已然显现。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

移动互联网 鸿蒙 ai android google
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论