近期,网友对豆包手机助手的截屏权限提出质疑,称其可获取银行安全键盘等受保护内容。12月13日晚,豆包手机助手发布技术说明,回应争议,强调采用原生截屏接口,无法截取受保护页面,同时对相关权限用途及运行原理进行了详细阐释,并表明对用户隐私安全的重视。
争议缘起:网友质疑豆包手机助手权限使用
近期,有网友发布视频称,“豆包手机助手通过READ_frame_BUFFER权限,从GPU渲染的图形缓冲区拿走图像数据,不需要走上层的截图API。还用了CAPTURE_SECURE_VIDEO_OUTPUT权限,可以获取银行安全键盘等受保护的界面内容”,对豆包手机助手的技术实现方式提出质疑。
官方回应:采用原生截屏接口,无法截屏受保护内容
豆包手机助手发布技术说明,称采用的是原生截屏接口(WindowManagerService.captureDisplay),严格遵循应用声明的Secure标记,无法截屏银行安全键盘等声明受保护的界面内容。同时强调,豆包手机助手仅在有用户指令时才会开始截屏,且无法截屏三方应用Secure标记页面,上传至云端大模型的截屏仅用于视觉理解和推理,完成任务后不会存储在云端。
权限解读:澄清两项权限真实用途
关于READ_frame_BUFFER权限,豆包手机助手表示是为了让AI可以在后台完成操作,让三方应用运行在虚拟屏空间中,为获取虚拟屏中运行的应用截图内容(对应方法WindowManagerService.captureDisplay)提供给豆包大模型推理,但该方法及权限无法读取到包括银行App在内的任何三方应用设置为Secure的内容。而CAPTURE_SECURE_VIDEO_OUTPUT权限的使用,是因为受保护的页面在虚拟屏的投影中会显示为黑屏,用户无法查看和操作,所以需要此权限将受保护的内容正常展示给用户并能够被用户操作,投影后受保护页面仍标记为Secure,仅能被用户查看,无法被截屏。
运行原理:用户指令驱动,截图上云分析
豆包手机助手操作手机功能的实现原理为:用户下达指令 -> 截屏发送给云端豆包大模型 -> 模型理解后返回具体操作 -> 手机端执行操作指令,不断重复直到完成任务。每一步操作后都需再截图上传给云端大模型分析,每步操作间隔约为3秒钟。由于分析界面所需的大模型参数较大,受限于芯片性能暂时无法运行在手机端侧,需要截图上传云端处理。目前国内多家手机厂商具有AI操作能力的助手产品,也是同样的实现原理,也会使用READ_frame_BUFFER等系统权限。
隐私态度:重视隐私安全,欢迎各界监督
豆包手机助手表示高度重视用户隐私安全,欢迎社会各界提出宝贵意见。团队会以负责任的态度沟通产品技术问题,把安全和信任做好,始终将隐私与安全作为产品设计的底线。
以上文章由 AI 总结生成

