返回顶部
b

browserbase-sessionsBrowserbase会话

Create and manage persistent Browserbase cloud browser sessions with authentication persistence. Use when you need to automate browsers, maintain logged-in sessions across interactions, scrape authenticated pages, or manage cloud browser instances.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 2.5.0
安全检测
已通过
1,203
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

browserbase-sessions

Browserbase 会话技能

通过 Browserbase 管理持久化云浏览器会话。该技能可创建浏览器会话,在交互过程中保留身份验证信息(Cookie、本地存储),自动解决验证码,并录制会话供后续查看。

智能体检查清单(主动执行)

  • - 如果缺少 BROWSERBASEAPIKEY 或 BROWSERBASEPROJECTID,请向用户索取(并告知查找位置)。在两者配置完成前,不要运行 Browserbase 命令。
  • 如果命令因缺少 Python 依赖而失败(browserbase / playwright 的 ImportError),请运行:
- python3 {baseDir}/scripts/browserbase_manager.py install - 然后重试原始命令。
  • - 询问用户想要持久化什么以及如何组织:
- 按应用/站点划分工作区(隔离):github、slack、stripe - 按任务/项目划分工作区(多站点工作流):invoice-run、lead-gen、expense-recon
  • - 工作区持久化:
- 通过 Browserbase 上下文(Cookie + 存储)保存登录状态 - 打开的标签页(URL + 标题快照),以便恢复上次的工作进度
  • - 当用户希望浏览器在聊天轮次之间保持打开状态时,优先使用工作区命令(create-workspace、start-workspace、resume-workspace、stop-workspace)而非原始会话命令。
  • 优先使用直接交互命令(list-tabs、new-tab、switch-tab、close-tab、click、type、press、wait-for、go-back、go-forward、reload、read-page),然后再回退到 execute-js。
  • 如果工作区/会话有 pending_handoff,先检查它再执行其他操作:
- python3 {baseDir}/scripts/browserbase_manager.py handoff --action check --workspace - 如果未完成,重新发送 suggestedusermessage 并停止。
  • - 每当浏览器被打开时(start-workspace、resume-workspace 或 create-session),立即分享人工远程控制链接:
- 优先使用命令输出中的 humanhandoff.shareurl。 - 回复用户时优先使用 humanhandoff.sharetext / humanhandoff.sharemarkdown。 - 回退到 humancontrolurl。 - 如果缺失,运行 live-url 并分享其 humanhandoff.shareurl。
  • - 当需要用户执行手动步骤时(SSO/MFA/验证码/同意屏幕),使用带有完成检查的交接
- 设置:python3 {baseDir}/scripts/browserbase_manager.py handoff --action set --workspace --instructions <要做什么> --url-contains <步骤后的URL片段>(或 --selector/--text/--cookie-name/...) - 稍后验证:python3 {baseDir}/scripts/browserbase_manager.py handoff --action check --workspace (或 --action wait)
  • - 关闭时,使用 stop-workspace(而非 terminate-session),以便保存标签页快照和持久化身份验证状态。

提示优化响应模式

使用简短一致的响应,让用户始终知道下一步操作。

当凭据缺失时:
text
在打开浏览器之前,我需要您的 Browserbase 凭据。
请提供:
1) BROWSERBASEAPIKEY
2) BROWSERBASEPROJECTID

当浏览器打开时(会话/工作区):
text
浏览器已就绪。
handoff.sharetext>
我可以在您浏览的同时继续工作。

当恢复现有工作区时:
text
已重新连接到您现有的工作区。
handoff.sharetext>

当需要人工步骤时(SSO/MFA/同意屏幕):
text
我需要您在实时浏览器中执行一个步骤:
1) <具体步骤>

打开:handoff.shareurl>
当您到达以下状态时停止:<特定的完成状态(URL 包含 / 选择器可见)>。
我会自动检测并继续。如果我没有检测到,请回复完成,我会重新检查。

当实时 URL 暂时不可用时:
text
远程控制 URL 暂时不可用。我现在重试。

首次设置

步骤 1 — 获取您的 Browserbase 凭据

  1. 1. 如果尚未注册,请访问 browserbase.com 注册。
  2. 前往 设置 → API 密钥 并复制您的 API 密钥(以 bblive_ 开头)。
  3. 前往 设置 → 项目 并复制您的项目 ID(一个 UUID)。

如果您有 API 密钥但不确定使用哪个项目 ID,可以列出项目:

bash
export BROWSERBASEAPIKEY=bbliveyourkeyhere
python3 {baseDir}/scripts/browserbase_manager.py list-projects

步骤 2 — 安装依赖

安装 Python 依赖和 Playwright Chromium(推荐):

bash
python3 {baseDir}/scripts/browserbase_manager.py install

手动替代方案(pip/uv):

bash
cd {baseDir}/scripts && pip install -r requirements.txt
python3 -m playwright install chromium

步骤 3 — 设置环境变量

bash
export BROWSERBASEAPIKEY=bbliveyourkeyhere
export BROWSERBASEPROJECTID=your-project-uuid-here

或通过 ~/.openclaw/openclaw.json(JSON5)中的 OpenClaw 的 skills.entries[browserbase-sessions].env 配置。由于此技能设置了 primaryEnv: BROWSERBASEAPIKEY,您也可以使用 skills.entries[browserbase-sessions].apiKey 作为 API 密钥:

json5
{
skills: {
entries: {
browserbase-sessions: {
enabled: true,
apiKey: bbliveyourkeyhere,
env: {
BROWSERBASEPROJECTID: your-project-uuid-here
}
}
}
}
}

步骤 4 — 运行设置测试

这将端到端验证所有内容(凭据、SDK、Playwright、API 连接和实时冒烟测试):

bash
python3 {baseDir}/scripts/browserbase_manager.py setup --install

您应该看到 status: success 且所有步骤通过。如果任何步骤失败,错误消息会准确告诉您需要修复什么。

默认设置

每个会话都使用以下默认设置创建,以支持研究工作流:

  • - 验证码解决:开启 — Browserbase 自动解决验证码,使登录流程和受保护页面无需人工干预即可工作。使用 --no-solve-captchas 禁用。
  • 会话录制:开启 — Browserbase 录制会话(仪表板中的视频;可通过 API 检索 rrweb 事件)。使用 --no-record 禁用。
  • 会话日志:开启 — Browserbase 捕获可通过 API 检索的会话日志。使用 --no-logs 禁用。
  • 身份验证持久化 — 如果使用上下文(或工作区),默认持久化身份验证状态。使用 --no-persist 禁用持久化。

能力与限制(明确说明)

智能体可以:

  • - 创建/检查/终止 Browserbase 会话和上下文。
  • 使用工作区(保持活动会话 + 恢复标签页)在聊天轮次之间保持浏览器打开。
  • 通过 Browserbase 上下文(persist=true)跨会话持久化登录状态。
  • 通过重新打开最后保存的打开标签页集合(URL + 标题快照)恢复您的位置。
  • 提供实时调试器 URL,以便用户在智能体继续工作时手动浏览。
  • 使用交互式浏览器控制:列出/打开/切换/关闭标签页、点击/输入/按键、等待选择器/文本/URL 状态、后退/前进/刷新以及读取页面文本/HTML/链接。
  • 截取屏幕截图、运行 JavaScript、读取 Cookie、获取日志和获取 rrweb 录制事件。

智能体不能:

  • - 无限期保持会话运行(Browserbase 强制执行超时;最大 6 小时)。
  • 恢复完整的浏览器历史记录(仅恢复打开的 URL)。
  • 被动观察用户在实时调试器中做什么。要检测用户操作,智能体必须重新连接并使用 handoff 或 wait-for 检查特定的完成条件(选择器/文本/URL/Cookie/存储)。
  • 在没有用户参与的情况下绕过 MFA/SSO。
  • 通过 API 下载仪表板视频(API 返回 rrweb

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 browserbase-sessions-1776419960 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 browserbase-sessions-1776419960 技能

通过命令行安装

skillhub install browserbase-sessions-1776419960

下载

⬇ 下载 browserbase-sessions v2.5.0(免费)

文件大小: 79.57 KB | 发布时间: 2026-4-17 19:17

v2.5.0 最新 2026-4-17 19:17
browserbase-sessions 2.5.0

- Added new `handoff` flow for handling human-in-the-loop steps (SSO/MFA/manual consent) with completion checks and response patterns.
- Updated agent checklist to proactively check for pending handoffs before performing actions.
- Improved instructions and prompt patterns for hybrid human+agent workflows, including clearer manual step detection and follow-up.
- Added session logs as a default (retrievable via API), with option to disable.
- Added automation script: `scripts/dedication_automation.mjs`.
- Added project metadata files: `CHANGELOG.md`, `LICENSE`, `package.json`, and `pnpm-lock.yaml`.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部