你有没有想过,如果 AI 编程助手不仅能写代码、读文档,还能像真人一样打开浏览器、填写表单、绕过验证码、调试网页问题——那开发自动化工作流的效率将彻底改变?Browserbase Skills 正是这样一套为 Claude Code 量身打造的「浏览器能力扩展包」,它把强大的网页自动化能力(基于 Browserbase 云浏览器平台)无缝接入 AI 工作流,让大模型真正拥有“动手上网”的实战技能。
它不是另一个爬虫库,也不是简单的 Puppeteer 封装,而是一套经过生产验证、专为 AI Agent 设计的可插拔技能系统——每项功能都自带反反爬策略、会话管理、诊断反馈和成本可视化,帮你把“让 AI 操作网页”这件事,从高风险试错变成标准化、可复现、可审计的工程实践。
核心功能
- 智能浏览器自动化(browser 技能):一条命令即可启动远程云浏览器,自动处理滑块验证码、启用住宅代理、模拟真实用户行为,有效规避主流网站的 Bot 检测机制。
- 官方 CLI 深度集成(browserbase-cli 技能):直接调用 Browserbase 官方
bb命令行工具,在 AI 流程中创建/管理项目、配置上下文、安装浏览器扩展、批量抓取页面,打通平台全链路能力。 - 一键部署无服务器脚本(functions 技能):将本地编写的浏览器自动化脚本(如登录+导出报表)打包为 Serverless 函数,直接部署到 Browserbase 云端执行,无需维护服务器或 Docker 环境。
- 网页自动化故障医生(site-debugger 技能):当你的自动化流程在某网站突然失败时,它能自动分析是否被识别为机器人、选择器是否失效、等待时机是否不足、登录态是否丢失或遭遇新类型 CAPTCHA,并生成带验证步骤的《站点适配手册》。
- 全链路操作录像回放(browser-trace 技能):在执行任意浏览器任务时同步录制完整的 Chrome DevTools 协议数据流(CDP)、关键节点截图、DOM 快照,支持按页面分片、关键词搜索、时间轴定位,极大提升调试效率。
- 用量与成本透明化(bb-usage 技能):实时查看当前账号的会话消耗、并发使用峰值、资源分布热图,并预测未来 7 天的运行成本,让团队在享受自动化红利的同时精准控本。
适合哪些人用
如果你是以下角色之一,Browserbase Skills 极可能成为你日常开发中的“效率加速器”:AI 工程师(构建 Claude 或其他 LLM Agent 时需增强 Web 能力)、RPA 开发者(厌倦了 Selenium 的脆弱性和维护成本)、数据采集工程师(需要稳定、合规、可扩展的网页交互方案)、前端测试负责人(希望用自然语言描述测试场景并自动生成可执行的端到端验证流程),以及技术型产品经理(快速验证竞品功能、模拟用户路径、生成产品调研快照)。
快速上手
只需三步即可启用:
1. 确保已安装 Node.js(v18+)和 Browserbase CLI(npm install -g @browserbase/cli),并完成 bb login 认证;
2. 在你的 Claude Code 项目中,将本仓库克隆至 skills/ 目录,或通过 npm 引入(支持 ESM/CJS);
3. 在 Claude 的技能配置中加载对应技能(如 skills/browser/SKILL.md),即可在对话中自然调用,例如:“请用 browser 技能登录我的 Shopify 后台,截图订单页并导出近 7 天销量 CSV”。详细配置见 GitHub 中各技能子目录下的 SKILL.md 文档。
项目信息
browserbase/skills
GitHub
Claude Agent SDK with a web browsing tool
JavaScript|891 ⭐|MIT 开源协议|GitHub 项目地址
这不仅是给 Claude 加个“浏览器插件”,更是为下一代 AI 原生工作流定义了一套可组合、可观察、可运维的 Web 交互标准——值得每一个想让 AI 真正“动手做事”的开发者收藏和实践。


