你是否曾为让AI智能体真正“看懂网页”而头疼?传统浏览器自动化工具(如Puppeteer、Playwright)依赖Node.js运行时,启动慢、内存高、部署复杂;而纯Rust实现的 agent-browser 正是为此而生——它是一个专为AI代理(AI Agents)设计的极简、高速、开箱即用的浏览器自动化命令行工具。无需写一行JavaScript,只需几条命令,就能让AI像人类一样打开网页、点击按钮、提取内容、截图留证,真正打通“大模型 + 真实网页世界”的最后一公里。
核心功能
- 零配置启动Chrome:内置自动下载并管理 Chrome for Testing(轻量、免登录、专为自动化优化),首次运行
agent-browser install即可获得稳定可控的浏览器环境 - 声明式任务执行:支持JSON/YAML格式描述操作序列(如“访问知乎首页 → 搜索‘Rust’ → 截图前3条结果”),AI Agent可直接生成并调用,无需手写控制逻辑
- 毫秒级响应与低资源占用:基于Rust原生开发,二进制体积小、启动快(平均<300ms)、内存常驻仅约80MB,远优于Node.js方案,特别适合高频调用的Agent服务
- 全平台一致体验:macOS(Homebrew一键安装)、Linux(自动处理字体/音视频依赖)、Windows(npm/Cargo双路径支持),一次学习,随处可用
- 智能版本管理:
agent-browser upgrade自动识别安装来源(npm/Homebrew/Cargo),精准升级,避免环境混乱 - 面向生产就绪:支持超时控制、失败重试、日志分级、截图/HTML快照导出,便于调试与审计,已用于Vercel内部多个AI工作流
适合哪些人用
如果你正在构建或使用以下类型的项目,agent-browser 就是为你量身打造的“隐形浏览器助手”:
- AI Agent开发者:需要让LLM驱动的智能体具备真实网页交互能力(如自动填写表单、监控竞品价格、抓取动态渲染内容)
- 自动化测试工程师:厌倦了臃肿的E2E框架,想要轻量、可靠、可嵌入CI/CD流水线的浏览器操作基座
- 低代码/无代码平台构建者:需为用户提供“网页操作模块”,但不想维护复杂的浏览器驱动兼容性
- 个人效率极客:想用脚本自动完成重复性网页任务(如每日打卡、信息聚合、舆情监测),追求启动快、不占内存、不弹窗
快速上手
安装只需一步,使用只需一行命令:
推荐方式(全局安装):
npm install -g agent-browser && agent-browser install
然后即可执行:
agent-browser run --url https://example.com --steps '[{"action":"click","selector":"a#login"}]'
更实用的方式是配合脚本:在 package.json 中添加
"scripts": {"scrape-news": "agent-browser run --config ./news-task.yaml"}
再运行 npm run scrape-news 即可全自动完成整套网页操作。
项目信息
Browser automation CLI for AI agents
30.9k
Stars
1.9k
Forks
Rust
Apache-2.0
编程语言:Rust|GitHub Star 数:30,891|开源协议:Apache-2.0
GitHub 项目地址
这是由 Vercel 实验室出品、已被全球数千个AI工程团队验证的高可靠性工具——它不炫技,只解决真问题:让AI真正“能上网”。


