每次浏览器自动化通常遵循以下模式:
# 1. 导航agent-browser open example.com
# 2. 获取元素 ref 快照agent-browser snapshot -i# 输出:# @e1 [heading] "Example Domain"# @e2 [link] "More information..."
# 3. 使用 refs 交互agent-browser click @e2
# 4. 页面变化后重新获取快照agent-browser snapshot -iagent-browser open example.comagent-browser snapshot -iagent-browser click @e2agent-browser fill @e3 "test@example.com"agent-browser get text @e1agent-browser screenshotagent-browser screenshot page.pngagent-browser close也支持 CSS 选择器和语义定位器:
agent-browser click "#submit"agent-browser fill "#email" "test@example.com"agent-browser find role button click --name "Submit"显示浏览器窗口以便调试:
agent-browser open example.com --headedagent-browser wait @e1agent-browser wait --load networkidleagent-browser wait --url "**/dashboard"agent-browser wait 2000可以用 && 在一次 shell 调用中串联命令。浏览器通过后台守护进程保持,所以链式调用安全且高效:
agent-browser open example.com && agent-browser wait --load networkidle && agent-browser snapshot -i
agent-browser fill @e1 "user@example.com" && agent-browser fill @e2 "pass" && agent-browser click @e3当不需要中间输出时使用 &&。如果需要先解析输出(例如先用 snapshot 发现 refs),则应分开运行命令。
JSON 输出
Section titled “JSON 输出”脚本中需要结构化解析时:
agent-browser snapshot --jsonagent-browser get text @e1 --json