文汇 前天
阶跃星辰开源 4B 模型,本地轻松部署,理解模糊指令,玩转安卓应用
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

上海大模型公司阶跃星辰近日开源的 GELab-Zero ,首次将 GUI Agent 模型与完整配套基建同步开放,支持手搓党一键部署。其中 4B GUI Agent 模型在手机端、电脑端等多个 GUI 榜单上全面刷新同尺寸模型性能纪录,取得 SOTA 成绩。此外,阶跃星辰还开源了基于真实业务场景的自建评测标准 AndroidDaily,以期推动 GUI 领域模型评测向消费级、规模化应用发展。目前,企业级用户和开发者已经可以通过 GitHub 和 HuggingFace 平台体验 GELab-Zero。

GUI(Graphical User Interface)意为图形用户界面。阶跃星辰在 ScreenSpot、OSWorld、MMBench、Android World 多个开源基准测试上对 GELab-Zero-4B-preview 模型进行了全面评估,涵盖了 GUI 理解、定位、交互等多个维度。测试结果显示,GELab-Zero-4B-preview 在多项权威开源基准测试中超越其他主流模型,拿下同尺寸 SOTA。同时,GELab-Zero-4B-preview 的表现还超越了参数量更大的 GUI-Owl-32B 等模型,性能更优也更易部署。

受访者供图

根据阶跃星辰官方介绍,GELab-Zero 提供一键拉起即可获得类似开源 GUI Agent MCP 的体验,在本地即可完成部署,并将推理链路完全掌控在自己手里。就具体能力而言,GELab-Zero 可支持 4B 量级模型在消费级硬件上运行,兼顾低延迟与隐私;与此同时,它还支持一键式多终端部署,能自动处理环境依赖和设备管理;可以分发到多台手机并记录交互轨迹,实现可观测、可复现;并支持多模态智能体范式:涵盖 ReAct 闭环、多智能体协作以及定时任务等多种工作模式。

在官方公布的应用场景示例中,GELab-Zero 可以很好地执行复杂任务和模糊指令,譬如能够精准地完成一次跨品类、涉及不同商品规格和数量的采购,也可以在接到 " 经典电影 "" 适合遛娃的地方 " 这类模糊和有主观色彩的需求时,自行判断执行标准并顺利完成任务。

据了解,阶跃星辰研发 GELab-Zero 的初衷,是解决 GUI Agent 面临的诸多工程侧难题——由于移动端应用生态极其碎片化,GUI Agent 在不同品牌、型号设备上运行时场景会在多设备 ADB 连接、依赖安装、权限配置、推理服务上线、任务编排与回放等方面出现工程问题,这意味着 Agent 开发者与 MCP 用户需要处理诸多工程基建工作,难以将精力集中于策略创新。

此前,阶跃星辰曾在 2025 世界人工智能大会期间公开展示了 " 一键执行助手 "AI 手机解决方案。接入该方案后,手机 Agent 助手可以基于用户指令自主执行包括追星打卡、点外卖、预约挂号、地图导航、缴纳社保、预订机票酒店、写朋友圈文案等各种任务,让手机 Agent 助手的能力从 " 能对话 " 延展到 " 会干活 ",进一步成为人类智慧伴生体。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

开源 上海 界面 基建
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论