第4期:基于 opencli-operate 的通用浏览器操控

更新于 2026/4/5

opencli operate 简介

如果遇到没有预装适配器的新网站,可以让 AI 使用 opencli operate 操控浏览器。

常用操作

  • opencli operate state: 让 AI 读取当前浏览器的 DOM 和状态
  • opencli operate click --selector "#login-btn": 指定元素点击
  • opencli operate type --selector "#search" --text "AI Agent": 自动化输入
  • opencli operate screenshot: 截取网站现状给到多模态大模型判定