中兴gui手机智能体获SuperCLUE测评总分第一超越阿里等

【CNMO 科技消息】近日，中文通用大模型评测基准 SuperCLUE 发布手机助手 gui 智能体测评 6 月榜单。结果显示，中兴 gui 手机智能体以 91.29 分位列总成绩第一，在全部评测维度中均排名首位。CNMO 科技注意到，此次测评共涵盖 6 款手机助手 GUI 智能体产品，重点面向具备智能体架构及配套模型的产品进行评估。

从总成绩来看，排名第 2 至第 6 的产品分别为智谱 AI Open-AutoGLM，得分 73.11 分；阿里巴巴 Mobile-Agent-3.5，得分 67.74 分；阿里巴巴 MAI-U1，得分 65.91 分；阶跃星辰 GELab-Zero，得分 54.26 分；字节跳动 UI-TARS，得分 30.19 分。按照公布数据，中兴 gui 手机智能体在总分上与其他参测产品拉开较大差距。

在分项维度方面，中兴 gui 手机智能体分别在复杂意图拆解与动态规划、多模态 gui 感知与理解、跨应用全链路执行等项目中获得第一。上述能力主要对应手机智能体在实际使用中的关键环节，包括对用户任务目标的理解、对手机界面信息的识别，以及在多个应用之间完成连续操作的执行能力。

根据 SuperCLUE 公布的测评说明，大模型与端侧 AI 的结合，正推动手机助手从传统语音或指令型助手，进一步演进为具备 gui 自动化和复杂任务规划能力的智能体。为建立相对统一的量化基准，此次评测在统一 ADB 手机交互与纯视觉输入环境下进行，并通过标准化任务集与评分体系，对各类 Agent 在意图解析、视觉感知和长链路执行任务中的决策质量进行衡量。

宙世代

一起剪

相关标签