Dograh AI:开源私有化语音AI智能体,拖拽式快速搭建电话机器人
一、Dograh AI是什么
Dograh AI是一款开源免费、支持私有化部署的实时语音人工智能智能体开发平台,项目由具备创业与技术研发经验的专业团队维护,遵循BSD 2-Clause宽松开源协议,个人开发者、企业团队均可免费使用、二次修改与商用部署。
该项目核心对标商用付费语音机器人SaaS平台,打破商用语音平台厂商锁定、数据托管受限、定制成本高昂的弊端。依托低代码可视化拖拽编排模式,用户无需深厚语音开发功底,短时间内即可搭建具备实时通话、语音交互、逻辑应答能力的电话语音机器人。平台兼容主流通话网关、大语言模型、语音转文字与文字转语音模型,同时提供本地容器化部署、云端托管双重使用模式,兼顾个人调试、中小企业业务落地与大型企业数据自主管控需求,是当下轻量化语音智能体落地的实用开源解决方案。
二、功能特色
低代码可视化流程编排
平台内置可视化操作面板,采用拖拽式编辑逻辑搭建语音对话流程,无需编写大量代码即可设定问答话术、分支判断、通话转接、挂断触发等规则,零基础人员也能快速完成机器人逻辑配置。全链路实时语音交互
支持低延迟双向语音对话,人声识别、语音播报响应流畅自然,还原真人通话体验,满足长时间连续通话、多轮问答交互场景使用。多渠道通话接入兼容
原生集成Twilio、Vonage等主流电话通信通道,支持电话呼入、主动外呼、人工客服无缝转接三类基础通话模式,适配常规通讯业务对接需求。自定义语音模型自由接入
不绑定固定语音模型,用户可自主接入任意开源、商用STT语音转文字模型、TTS文字转语音模型以及LLM大语言模型,按需匹配音色、识别精度与应答风格。便捷线上自测调试能力
后台搭载Web网页通话测试功能,无需外接实体电话线路、通信硬件,在浏览器内即可直接发起通话测试,实时校验对话逻辑、语音效果与应答准确性,大幅缩减调试周期。灵活部署与权限管控
提供Docker容器一键部署方案,支持本地电脑、私有服务器离线私有化部署,数据全程留存自有设备;同时官方提供云端托管服务,适配不同团队部署偏好。标准化开发接口配套
配套Python、Node.js多语言SDK与专属API密钥,可与企业现有办公系统、业务管理平台、客户管理系统打通对接,实现语音业务数据互通联动。

三、技术细节
3.1 整体技术架构
项目采用前后端分离模块化架构,各功能模块独立解耦,降低维护与二次开发难度,整体架构分工清晰:
业务后端:以FastAPI作为核心服务框架,承担接口请求处理、对话逻辑运算、模型调度、通话状态管理核心工作,高并发适配多线路同时通话场景。
实时通讯:基于WebRTC实时音视频传输协议、pipecat语音处理框架,保障语音数据流低延迟传输,规避通话卡顿、声音断层问题。
前端界面:使用Next.js框架开发可视化管理面板,页面交互流畅,拖拽编辑、参数配置、数据查看操作直观易懂。
网络穿透:集成Coturn服务,解决内网部署场景下的音视频网络穿透难题,保障跨网络通话正常连通。
3.2 部署运行技术
全程基于Docker、Docker Compose容器化打包封装,所有运行依赖、环境配置内置镜像,使用者无需手动配置系统环境、安装程序组件,一条命令即可完成整套服务拉取、启动运行,兼容主流Linux服务器、本地PC系统。搭配Nginx反向代理服务,优化访问链路,提升面板访问稳定性与访问速度。
3.3 模型与数据处理机制
语音识别、语音合成、智能问答三大模块相互独立调度,服务仅负责调用对接外部模型接口,不强制绑定模型内核。通话语音数据、对话记录、配置数据默认存储于部署本地服务器,私有化部署模式下外部无法调取数据,保障业务数据隐私安全。
3.4 程序版本与运行基础
项目持续迭代更新,当前稳定版本为v1.31.0,不断修复通话漏洞、优化交互体验、拓展兼容通道。运行无严苛硬件门槛,普通服务器、家用主机均可承载基础语音机器人运行,扩容可支撑企业级批量通话业务。
四、应用场景
智能客服接待:企业进线咨询电话自动应答,解答产品价格、售后流程、营业时间等常规问题,分流基础咨询,减轻人工客服工作压力。
营销外呼筛选:批量外呼客户电话,自动推送业务介绍,筛选意向客户并分类标记,为线下销售团队精准推送有效客源。
政务便民语音咨询:社区、政务单位搭建语音问答机器人,解答办事材料、办理流程、政策相关常见问题。
通知回访语音播报:自动发起电话回访、缴费提醒、活动通知、售后回访等批量语音通知工作,替代人工重复拨号通话。
个人语音助手调试:开发者用于语音交互逻辑、大模型对话能力测试,快速验证语音项目开发思路。
五、使用方法
5.1 容器化一键部署
打开服务器终端,执行下方部署命令,自动拉取项目镜像并启动服务
curl -o docker-compose.yaml https://raw.githubusercontent.com/dograh-hq/dograh/main/docker-compose.yaml && REGISTRY=ghcr.io/dograh-hq ENABLE_TELEMETRY=true docker compose up --pull always
5.2 后台页面访问
部署完成后,在浏览器输入本地访问地址:http://localhost:3010,进入Dograh AI管理控制台,完成账号初始化设置。
5.3 创建语音智能体
在控制台首页点击新建机器人项目,标注机器人使用用途与业务类型;
采用拖拽方式编辑对话流程,设置问答内容、分支跳转、转接规则;
按需绑定STT、TTS、LLM对应模型接口,调整语音音色、应答语速参数。
5.4 线上测试与正式启用
点击页面Web Call测试按钮,网页内发起模拟通话,核验对话逻辑与语音效果;
接入Twilio、Vonage通话线路,配置呼入、外呼权限;
调试无误后正式上线,投入实际电话通话业务使用。
5.5 系统对接拓展
调用平台配套SDK与API接口,将语音机器人嵌入企业现有业务系统,实现数据同步、业务联动运行。
六、竞品对比
选取行业主流两款商用语音智能体平台Vapi、Retell,与Dograh AI进行多维度对比:
| 对比维度 | Dograh AI | Vapi | Retell |
|---|---|---|---|
| 开源属性 | BSD 2-Clause完全开源,可修改源码 | 闭源商用软件,无源码权限 | 闭源商用软件,禁止二次开发 |
| 部署模式 | 本地私有化部署+云端托管双模式 | 仅官方云端SaaS部署 | 仅官方云端SaaS部署 |
| 模型使用权限 | 自由对接各类第三方语音、大模型 | 仅限平台内置模型,无法外接自定义模型 | 模型绑定平台,自定义接入受限 |
| 数据管控 | 数据存储自有设备,自主掌控 | 数据留存厂商云端平台 | 数据统一托管服务商服务器 |
| 厂商绑定程度 | 无绑定,可随意迁移服务 | 高度绑定,无法脱离平台使用 | 平台绑定,迁移成本极高 |
| 商用成本 | 开源免费,无基础使用费 | 按通话时长、线路按量收费 | 阶梯式套餐收费,长期使用成本偏高 |
七、常见问题解答
Dograh AI部署对服务器系统有要求吗?
项目依托Docker容器运行,主流Linux系统均可正常部署,Windows、macOS系统也可借助容器工具完成本地调试部署,适配性广泛。
私有化部署后通话数据会不会泄露?
私有化部署场景下所有通话录音、对话内容、配置信息均存储在自身服务器中,平台官方无法获取本地数据,能够有效保障数据隐私安全。
零基础代码基础可以使用该项目搭建语音机器人吗?
可以,平台核心操作依靠可视化拖拽完成,无需编写代码,仅部署环节执行简单终端命令,普通使用者也能独立完成机器人搭建调试。
是否能够商用落地使用?
项目遵循宽松BSD 2-Clause开源协议,个人、企业均可免费商用,也支持基于源码进行功能修改与二次开发。
无法接入外部自定义语音模型是什么原因?
大概率是模型接口参数填写错误、网络访问受限,核对接口地址、密钥信息,同时检查服务器网络连通状态即可排查解决。
Web网页测试通话无声音该如何处理?
优先检查浏览器麦克风、扬声器权限是否开启,其次查看服务运行状态与音视频传输配置,重启服务后重新发起测试即可。
八、相关链接
GitHub仓库地址:https://github.com/dograh-hq/dograh
九、总结
Dograh AI凭借开源免费、私有化部署的核心优势,补齐了商用语音智能体平台数据管控弱、定制门槛高、使用成本昂贵的短板,搭配低代码可视化编辑、多模型兼容、网页自测等实用功能,既降低了语音机器人的开发搭建门槛,也满足企业对于数据自主可控的核心需求。项目技术架构成熟稳定,部署方式简单便捷,可灵活适配客服接待、营销外呼、通知回访等多元化语音业务场景,同时开放源码与开发接口,支持开发者深度定制拓展,是兼顾个人学习开发与企业实际业务落地的优质开源实时语音AI智能体平台。
版权及免责申明:本文由@97ai原创发布。该文章观点仅代表作者本人,不代表本站立场。本站不承担任何相关法律责任。
如若转载,请注明出处:https://www.aipuzi.cn/ai-news/dograh-ai.html

