手机中国 昨天
中兴gui手机智能体获SuperCLUE测评总分第一 超越阿里等
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

【CNMO 科技消息】近日,中文通用大模型评测基准 SuperCLUE 发布手机助手 gui 智能体测评 6 月榜单。结果显示,中兴 gui 手机智能体以 91.29 分位列总成绩第一,在全部评测维度中均排名首位。CNMO 科技注意到,此次测评共涵盖 6 款手机助手 GUI 智能体产品,重点面向具备智能体架构及配套模型的产品进行评估。

从总成绩来看,排名第 2 至第 6 的产品分别为智谱 AI Open-AutoGLM,得分 73.11 分;阿里巴巴 Mobile-Agent-3.5,得分 67.74 分;阿里巴巴 MAI-U1,得分 65.91 分;阶跃星辰 GELab-Zero,得分 54.26 分;字节跳动 UI-TARS,得分 30.19 分。按照公布数据,中兴 gui 手机智能体在总分上与其他参测产品拉开较大差距。

在分项维度方面,中兴 gui 手机智能体分别在复杂意图拆解与动态规划、多模态 gui 感知与理解、跨应用全链路执行等项目中获得第一。上述能力主要对应手机智能体在实际使用中的关键环节,包括对用户任务目标的理解、对手机界面信息的识别,以及在多个应用之间完成连续操作的执行能力。

根据 SuperCLUE 公布的测评说明,大模型与端侧 AI 的结合,正推动手机助手从传统语音或指令型助手,进一步演进为具备 gui 自动化和复杂任务规划能力的智能体。为建立相对统一的量化基准,此次评测在统一 ADB 手机交互与纯视觉输入环境下进行,并通过标准化任务集与评分体系,对各类 Agent 在意图解析、视觉感知和长链路执行任务中的决策质量进行衡量。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

中兴 阿里巴巴 字节跳动 ai 自动化
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论