Babysitter 是一个专为 AI 智能体(AI Agents)设计的轻量级、可嵌入式编排引擎,它不依赖复杂基础设施,却能确保多个大模型驱动的智能体严格按规则执行任务——杜绝胡说八道(hallucination),拒绝随意发挥,真正实现“指哪打哪”的确定性协作。它解决的是当前 Agentic AI 落地中最棘手的痛点:智能体越聪明,越容易失控;流程越复杂,越难追溯和纠错。
核心功能
- 确定性自我编排(Self-Orchestration):无需人工写状态机或 DAG 图,智能体通过内置协议自主协商分工、传递上下文、校验结果,全程可复现、可审计
- 防幻觉强制约束机制:在推理链关键节点插入语义校验、工具调用白名单、输出 Schema 验证,从源头拦截错误生成与越界行为
- 跨平台插件化技能管理:原生支持 Claude Code、Hermes、Pi、Codex 等主流编码助手的技能封装(Skills)与工作流(Workflows),一套 Babysitter SDK 适配多引擎
- 极简 CLI 工具链(Harness CLI):提供命令行快速启动调试环境、回放历史会话、可视化执行轨迹,开发者 30 秒即可跑通端到端智能体协作 demo
- 零信任压缩通信(Compression):自动对智能体间长文本消息进行语义保真压缩,在降低 token 开销的同时维持指令完整性,实测减少 40%+ API 成本
- 可信 AI 实践框架:内置日志签名、执行沙箱、权限分级等模块,满足企业级对可解释性、可控性与合规性的硬性要求
适合哪些人用
如果你是以下角色之一,Babysitter 值得立刻加入你的技术栈:AI 应用工程师(正在构建客服机器人、自动化研发生态、数据分析师助手等多智能体系统);LLM Ops 工程师(需要统一管控 Claude / Hermes / Codex 等异构模型的行为边界);开源工具链创作者(希望为自己的 AI 插件/扩展提供标准化执行底座);以及高校与研究团队(探索可信智能体协作范式、可验证自治系统的实践者)。它不是另一个“全能大模型”,而是一个让大模型团队变得守纪律、高效率、易维护的“数字班组长”。
快速上手
只需两步即可启动首个协作工作流:
- 安装 SDK:
npm install @a5c-ai/babysitter-sdk - 编写 10 行 JS 定义两个智能体(如“需求分析员”+“代码生成器”),调用
babysit()启动协同流程,Babysitter 自动处理任务分发、中间校验与结果聚合 - 进阶用户可直接使用
npx babysitter-cli init创建模板项目,或集成至 VS Code 扩展、Next.js 后端服务中
官方提供全中文入门指南、Claude Code 技能迁移手册及 7 个真实场景 Demo(含自动化 PR 评审、多跳数据查询、合规文档生成),所有文档均托管于 GitHub Wiki 并持续更新。
项目信息
a5c-ai/babysitter
GitHub
Babysitter enforces obedience on agentic workforces and enables them to manage extremely complex tasks and workflows through deterministic, hallucinat
编程语言:JavaScript|GitHub Star 数:1101|开源协议:MIT|GitHub 项目地址
当你厌倦了反复调试“AI 忘记指令”“智能体互相矛盾”“流程崩在第三步”的崩溃时刻——Babysitter 就是那个默默站在背后、让整个 AI 团队准时交作业的靠谱管家。


