IT之家 6小时前
豆包手机助手使用系统原生截屏接口,无法截屏银行键盘等内容
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

IT 之家 12 月 13 日消息,豆包手机助手今晚发布技术说明,称豆包手机助手使用系统原生截屏接口,无法截屏银行键盘等受保护内容。

IT 之家从说明获悉,近期有网友发布视频称," 豆包手机助手通过 READ_FRAME_BUFFER 权限,从 GPU 渲染的图形缓冲区拿走图像数据,不需要走上层的截图 API。还用了 CAPTURE_SECURE_VIDEO_OUTPUT 权限,可以获取银行安全键盘等受保护的界面内容 "。这是对豆包手机助手技术实现方式的错误解读

豆包手机助手采用的是原生截屏接口(WindowManagerService.captureDisplay),严格遵循应用声明的 Secure 标记,无法截屏银行安全键盘等声明受保护的界面内容。任何持有豆包手机助手技术预览版的用户,都可以自己写一个带有受保护页面的 APK 进行测试,让 AI 讲解页面内容,可以验证 AI 是无法看到的。

豆包进一步说明,网友提到的 READ_FRAME_BUFFER 权限,是为了让 AI 可以在后台完成操作,豆包手机助手让三方应用运行在虚拟屏空间中。为了获取虚拟屏中运行的应用截图内容(对应方法 WindowManagerService.captureDisplay)提供给豆包大模型推理,所以需要 READ_FRAME_BUFFER 权限,但该方法以及权限无法读取到包括银行 App 在内的任何三方应用设置为 Secure 的内容

▲ 豆包手机助手无法读取受系统保护的界面内容

CAPTURE_SECURE_VIDEO_OUTPUT 权限的使用,是因为受保护的页面在虚拟屏的投影(即点击灵动岛打开的粉色边缘的应用界面)中会显示为黑屏,用户无法查看和操作,所以需要此权限将受保护的内容正常展示给用户并能够被用户操作。但在投影后,受保护的页面仍会标记为 Secure,仅能被用户查看,无法被截屏。

豆包手机助手操作手机功能的实现原理是:用户下达指令 -> 截屏发送给云端豆包大模型 -> 模型理解后返回具体操作 -> 手机端执行操作指令,不断重复直到完成任务。因此每一步操作后都需要再截图上传给云端大模型分析,每步操作间隔约为 3 秒钟。

由于分析界面所需的大模型参数较大,受限于芯片性能暂时无法运行在手机端侧,需要截图上传云端处理。据了解,目前国内多家手机厂商具有 AI 操作能力的助手产品,也是同样的实现原理,也会使用 READ_FRAME_BUFFER 等系统权限。

豆包强调,豆包手机助手仅在有用户指令时才会开始截屏,且无法截屏三方应用 Secure 标记页面。上传至云端大模型的截屏仅用于视觉理解和推理,完成任务后不会存储在云端。

豆包手机助手表示高度重视用户隐私安全,欢迎社会各界提出宝贵意见。团队会以负责任的态度沟通产品技术问题,把安全和信任做好。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论