开源语音助手开发平台：5分钟自建电话客服机器人，告别Vapi/Retell锁定

昆仑 AI

2026-05-18 0 134

Dograh 是一个真正开源、可完全自托管的语音智能体（Voice Agent）开发平台，让你无需依赖云厂商，就能快速构建具备通话能力的AI语音助手——比如自动外呼销售机器人、24小时客服应答系统、语音交互式IVR菜单等。它直击当前语音AI开发的两大痛点：商业平台（如Vapi、Retell）价格高、数据不透明、无法深度定制；而从零手写WebRTC+ASR+TTS+LLM集成又门槛极高、耗时数周。Dograh 把复杂性封装进直观的拖拽式工作流，让开发者和产品团队用“搭积木”的方式，在2分钟内完成首个可通话的语音机器人。

核心功能

可视化拖拽工作流引擎：类Node-RED的图形化界面，轻松编排语音输入→实时转文字（STT）→大模型推理→文本转语音（TTS）→双向通话（VoIP/WebRTC）全流程，支持条件分支、变量传递与API调用
全链路自托管支持：前端（Next.js）、后端（FastAPI）、语音处理（Pipecat）、信令与媒体（WebRTC + SIP/VOIP）全部开源，可一键部署在自有服务器或私有云，通话数据不出内网
灵活模型即插即用：原生兼容主流开源/商用LLM（Llama 3、Qwen、Claude、GPT）、STT（Whisper、Vosk、NVIDIA NeMo）和TTS（XTTS、Coqui TTS、ElevenLabs），无需改代码即可切换供应商
真实电话场景就绪：内置外呼（Outbound Calls）能力，支持对接Twilio、Telnyx等SIP网关，也可直连企业PBX，轻松实现“拨打客户手机→AI自动对话→记录通话摘要”闭环
生产级可靠性设计：提供会话状态持久化、错误重试机制、实时日志追踪、通话录音存档与标注工具，满足金融、医疗等合规敏感行业的基础要求
活跃社区与企业就绪支持：由Y Combinator校友及连续创业者主导维护，Slack社区超2000+开发者，文档详尽（含部署指南、安全配置、性能调优），并提供商业支持选项

适合哪些人用

如果你是以下角色之一，Dograh 将极大提升你的语音AI落地效率：创业公司CTO（想低成本验证语音SaaS产品）、企业内部AI平台工程师（需构建合规可控的客服/工单语音入口）、全栈开发者（厌倦了反复造轮子，渴望开箱即用的语音基建）、高校研究者（需要可复现、可修改的端到端语音代理实验环境），甚至技术型产品经理也能通过拖拽界面快速原型验证用户需求。

快速上手

自托管仅需一条命令（确保已安装Docker）：

curl -fsSL https://raw.githubusercontent.com/dograh-hq/dograh/main/scripts/start.sh | bash

约60秒后，访问 http://localhost:3000 即可进入Web控制台。首次使用推荐体验官方预置的「天气查询」或「技术支持问答」模板——导入后点击「部署」，再用手机拨打平台分配的测试号码，即可与你的AI语音助手实时对话。详细步骤、Docker Compose定制、GPU加速TTS配置等，均在官方文档中分步说明。