【CNMO 科技消息】近日,中文通用大模型评测基准 SuperCLUE 发布手机助手 gui 智能体测评 6 月榜单。结果显示,中兴 gui 手机智能体以 91.29 分位列总成绩第一,在全部评测维度中均排名首位。CNMO 科技注意到,此次测评共涵盖 6 款手机助手 GUI 智能体产品,重点面向具备智能体架构及配套模型的产品进行评估。


从总成绩来看,排名第 2 至第 6 的产品分别为智谱 AI Open-AutoGLM,得分 73.11 分;阿里巴巴 Mobile-Agent-3.5,得分 67.74 分;阿里巴巴 MAI-U1,得分 65.91 分;阶跃星辰 GELab-Zero,得分 54.26 分;字节跳动 UI-TARS,得分 30.19 分。按照公布数据,中兴 gui 手机智能体在总分上与其他参测产品拉开较大差距。

在分项维度方面,中兴 gui 手机智能体分别在复杂意图拆解与动态规划、多模态 gui 感知与理解、跨应用全链路执行等项目中获得第一。上述能力主要对应手机智能体在实际使用中的关键环节,包括对用户任务目标的理解、对手机界面信息的识别,以及在多个应用之间完成连续操作的执行能力。

根据 SuperCLUE 公布的测评说明,大模型与端侧 AI 的结合,正推动手机助手从传统语音或指令型助手,进一步演进为具备 gui 自动化和复杂任务规划能力的智能体。为建立相对统一的量化基准,此次评测在统一 ADB 手机交互与纯视觉输入环境下进行,并通过标准化任务集与评分体系,对各类 Agent 在意图解析、视觉感知和长链路执行任务中的决策质量进行衡量。


登录后才可以发布评论哦
打开小程序可以发布评论哦