Dograh 是一个真正开源、可完全自托管的语音智能体(Voice Agent)开发平台,让你无需依赖云厂商,就能快速构建具备通话能力的AI语音助手——比如自动外呼销售机器人、24小时客服应答系统、语音交互式IVR菜单等。它直击当前语音AI开发的两大痛点:商业平台(如Vapi、Retell)价格高、数据不透明、无法深度定制;而从零手写WebRTC+ASR+TTS+LLM集成又门槛极高、耗时数周。Dograh 把复杂性封装进直观的拖拽式工作流,让开发者和产品团队用“搭积木”的方式,在2分钟内完成首个可通话的语音机器人。
核心功能
- 可视化拖拽工作流引擎:类Node-RED的图形化界面,轻松编排语音输入→实时转文字(STT)→大模型推理→文本转语音(TTS)→双向通话(VoIP/WebRTC)全流程,支持条件分支、变量传递与API调用
- 全链路自托管支持:前端(Next.js)、后端(FastAPI)、语音处理(Pipecat)、信令与媒体(WebRTC + SIP/VOIP)全部开源,可一键部署在自有服务器或私有云,通话数据不出内网
- 灵活模型即插即用:原生兼容主流开源/商用LLM(Llama 3、Qwen、Claude、GPT)、STT(Whisper、Vosk、NVIDIA NeMo)和TTS(XTTS、Coqui TTS、ElevenLabs),无需改代码即可切换供应商
- 真实电话场景就绪:内置外呼(Outbound Calls)能力,支持对接Twilio、Telnyx等SIP网关,也可直连企业PBX,轻松实现“拨打客户手机→AI自动对话→记录通话摘要”闭环
- 生产级可靠性设计:提供会话状态持久化、错误重试机制、实时日志追踪、通话录音存档与标注工具,满足金融、医疗等合规敏感行业的基础要求
- 活跃社区与企业就绪支持:由Y Combinator校友及连续创业者主导维护,Slack社区超2000+开发者,文档详尽(含部署指南、安全配置、性能调优),并提供商业支持选项
适合哪些人用
如果你是以下角色之一,Dograh 将极大提升你的语音AI落地效率:创业公司CTO(想低成本验证语音SaaS产品)、企业内部AI平台工程师(需构建合规可控的客服/工单语音入口)、全栈开发者(厌倦了反复造轮子,渴望开箱即用的语音基建)、高校研究者(需要可复现、可修改的端到端语音代理实验环境),甚至技术型产品经理也能通过拖拽界面快速原型验证用户需求。
快速上手
自托管仅需一条命令(确保已安装Docker):
curl -fsSL https://raw.githubusercontent.com/dograh-hq/dograh/main/scripts/start.sh | bash
约60秒后,访问 http://localhost:3000 即可进入Web控制台。首次使用推荐体验官方预置的「天气查询」或「技术支持问答」模板——导入后点击「部署」,再用手机拨打平台分配的测试号码,即可与你的AI语音助手实时对话。详细步骤、Docker Compose定制、GPU加速TTS配置等,均在官方文档中分步说明。
项目信息
Open Source Voice Agent Platform
编程语言:Python(后端核心)+ TypeScript/Next.js(前端)| GitHub Star 数:1579(持续快速增长中)| 开源协议:BSD-2-Clause| GitHub 项目地址
如果你相信语音交互的未来不该被少数闭源平台定义,那么Dograh就是此刻最值得投入时间了解的开源答案——自由、透明、强大,且真的能跑通生产环境。




