Skip to content

摄像头拍照(agent)

OpenClaw 支持在 agent 工作流中使用摄像头

  • iOS 节点(通过 Gateway 配对):经由 node.invoke 拍摄照片jpg)或短视频mp4,可选音频)。
  • Android 节点(通过 Gateway 配对):经由 node.invoke 拍摄照片jpg)或短视频mp4,可选音频)。
  • macOS 应用(通过 Gateway 的节点):经由 node.invoke 拍摄照片jpg)或短视频mp4,可选音频)。

所有摄像头访问都需要通过用户控制的设置才能使用。

iOS 节点

用户设置(默认开启)

  • iOS 设置页 → CameraAllow Cameracamera.enabled
    • 默认:开启(缺少该键时视为已启用)。
    • 关闭时:camera.* 命令返回 CAMERA_DISABLED

命令(通过 Gateway node.invoke

  • camera.list

    • 响应载荷:
      • devices{ id, name, position, deviceType } 数组
  • camera.snap

    • 参数:
      • facingfront|back(默认:front
      • maxWidth:数字(可选;iOS 节点默认 1600
      • quality0..1(可选;默认 0.9
      • format:目前仅 jpg
      • delayMs:数字(可选;默认 0
      • deviceId:字符串(可选;来自 camera.list
    • 响应载荷:
      • format: "jpg"
      • base64: "<...>"
      • widthheight
    • 载荷保护:照片会被重新压缩,确保 base64 载荷不超过 5 MB。
  • camera.clip

    • 参数:
      • facingfront|back(默认:front
      • durationMs:数字(默认 3000,最大限制 60000
      • includeAudio:布尔值(默认 true
      • format:目前仅 mp4
      • deviceId:字符串(可选;来自 camera.list
    • 响应载荷:
      • format: "mp4"
      • base64: "<...>"
      • durationMs
      • hasAudio

前台要求

canvas.* 一样,iOS 节点只允许在前台执行 camera.* 命令。后台调用返回 NODE_BACKGROUND_UNAVAILABLE

CLI 辅助工具(临时文件 + MEDIA)

获取附件最简单的方式是通过 CLI 辅助工具,它将解码后的媒体写入临时文件并输出 MEDIA:<路径>

示例:

bash
openclaw nodes camera snap --node <id>               # 默认:前置 + 后置(2 行 MEDIA)
openclaw nodes camera snap --node <id> --facing front
openclaw nodes camera clip --node <id> --duration 3000
openclaw nodes camera clip --node <id> --no-audio

注意事项:

  • nodes camera snap 默认两个方向都拍,让 agent 同时获得前置和后置视角。
  • 输出文件是临时文件(在操作系统临时目录中),除非你自己封装处理逻辑。

Android 节点

Android 用户设置(默认开启)

  • Android 设置面板 → CameraAllow Cameracamera.enabled
    • 默认:开启(缺少该键时视为已启用)。
    • 关闭时:camera.* 命令返回 CAMERA_DISABLED

权限

  • Android 需要运行时权限:
    • CAMERAcamera.snapcamera.clip 都需要。
    • RECORD_AUDIOcamera.clipincludeAudio=true 时需要。

如果缺少权限,应用会在可能时弹出权限申请;如果已被拒绝,camera.* 请求会返回 *_PERMISSION_REQUIRED 错误。

Android 前台要求

canvas.* 一样,Android 节点只允许在前台执行 camera.* 命令。后台调用返回 NODE_BACKGROUND_UNAVAILABLE

Android 命令(通过 Gateway node.invoke

  • camera.list
    • 响应载荷:
      • devices{ id, name, position, deviceType } 数组

载荷保护

照片会被重新压缩,确保 base64 载荷不超过 5 MB。

macOS 应用

用户设置(默认关闭)

macOS 伴侣应用提供一个复选框:

  • 设置 → General → Allow Cameraopenclaw.cameraEnabled
    • 默认:关闭
    • 关闭时:摄像头请求返回"Camera disabled by user"。

CLI 辅助工具(node invoke)

使用主 openclaw CLI 在 macOS 节点上调用摄像头命令。

示例:

bash
openclaw nodes camera list --node <id>            # 列出摄像头 ID
openclaw nodes camera snap --node <id>            # 输出 MEDIA:<路径>
openclaw nodes camera snap --node <id> --max-width 1280
openclaw nodes camera snap --node <id> --delay-ms 2000
openclaw nodes camera snap --node <id> --device-id <id>
openclaw nodes camera clip --node <id> --duration 10s          # 输出 MEDIA:<路径>
openclaw nodes camera clip --node <id> --duration-ms 3000      # 输出 MEDIA:<路径>(旧参数)
openclaw nodes camera clip --node <id> --device-id <id>
openclaw nodes camera clip --node <id> --no-audio

注意事项:

  • openclaw nodes camera snap 默认 maxWidth=1600,除非另行指定。
  • macOS 上,camera.snap 在预热/曝光稳定后等待 delayMs(默认 2000ms)才拍摄。
  • 照片载荷会被重新压缩,确保 base64 不超过 5 MB。

安全与实用限制

  • 摄像头和麦克风访问会触发操作系统权限提示(iOS/Android 需要在 Info.plist 中填写使用说明)。
  • 视频片段有时长上限(目前 <= 60s),以避免超大节点载荷(base64 开销 + 消息大小限制)。

macOS 屏幕录制(系统级)

录制屏幕视频(非摄像头),使用 macOS 伴侣应用:

bash
openclaw nodes screen record --node <id> --duration 10s --fps 15   # 输出 MEDIA:<路径>

注意:

  • 需要 macOS Screen Recording 权限(TCC)。