口播智能体 (短视频 AI 数字人创作工具)
- 软件版本:8.0.0
- 软件类型:视频软件
- 软件语言:简体中文
- 运行环境:Android
- 软件大小:57 MB
- 发布时间:
口播智能体是什么
口播智能体是开源免费Flutter开发的安卓端短视频一站式AI创作工具,面向短视频博主、知识博主、带货达人、自媒体从业者打造,完整打通提取同行文案→AI原创改写→合规违禁词检测→AI配音/声音克隆→照片生成数字人口播视频全流程,无需电脑剪辑,手机端独立完成整条口播短视频制作,底层采用本地加密存储用户密钥与创作素材,支持自定义接入各类大模型、TTS语音、数字人视频API,无强制内置付费,是轻量化、隐私优先的开源短视频口播生产工具。
口播智能体区别于市面上闭源收费剪辑工具,核心优势为开源本地部署、自带免费TTS、自带法务审核、数字人一键生成。
底层开发:基于Flutter 3.x全Dart开发,跨端适配安卓,状态管理采用Riverpod,本地数据库sqflite存储全部文案、音频、视频记录,API密钥通过flutter_secure_storage加密保存,不会上传隐私密钥至第三方服务器;
核心业务逻辑:解决自媒体三大痛点:同行文案搬运违规、人工配音耗时、真人出镜拍摄成本高。仅需粘贴短视频链接即可抓取原文,AI多重改写实现原创去重,内置违禁词库规避平台限流、广告法违规风险,搭配免费语音合成生成自然口播音频,上传单张人像照片即可调用数字人API生成对口型口播短片;
使用模式:双模式运行,一是直接下载编译好的APK安装即用,二是开发者可拉取GitHub源码本地自定义二次开发,自由替换AI模型、语音接口、数字人服务商;
适用场景:抖音/快手/视频号知识口播、好物带货、科普解说、财经分享、门店本地宣传、知识IP批量起号。

软件功能
1. 短视频文案提取与AI改写
粘贴短视频链接自动抓取完整口播脚本,支持本地文本手动导入;
6种改写模式:同义润色、口语化改编、扩写、精简缩句、风格切换、批量去重;
一次性生成3版差异化文案,AI自动打分排序,快速筛选高原创度脚本;
自动生成配套短视频标题、热门话题标签。
2. 法务合规违禁词审核
双重检测机制:内置广告法/平台敏感词词库过滤 + 大模型深度内容风险筛查;
一键标记违规词汇,提供替换建议,降低限流、下架、扣分风险;
支持自定义新增行业专属敏感词,适配电商、医疗、财经等特殊领域。
3. AI语音合成&声音克隆
内置免费Edge-TTS,海量男女音色、方言、朗读语速自由调节;
支持CosyVoice高品质音色,自定义录制样本完成个人声音克隆;
音频导出保存本地,支持裁剪、分段、循环播放预览。
4. 照片数字人口播视频生成
上传单张人像照片,输入配音文案一键生成同步口型数字人短片;
依托飞影数字人API驱动,匹配语音自动生成眨眼、微笑微表情;
视频本地缓存保存,支持直接分享至短视频平台。
5. 素材本地管理中心
文案、音频、数字人视频分栏归档,关键词快速检索;
批量删除、导出、备份全部创作素材;
缓存清理功能,释放手机存储空间。
6. 自定义API配置中心
自由填入大模型、TTS、数字人服务商密钥;
多套密钥分组保存,一键切换服务商;
密钥加密本地存储,杜绝隐私泄露。
软件特色
完全开源免费无捆绑:开源项目,无内置广告、无强制会员,个人商用均可免费使用,源码可自主修改;
隐私本地优先:文案、录音、API密钥全部存在手机本地,不强制上传云端,不存在内容泄露风险;
轻量化手机独立创作:无需电脑、无需专业剪辑软件,一部安卓手机完成完整口播视频生产;
自带免费配音能力:内置Edge免费语音合成,新手无需额外充值语音接口;
原创风控一体化:改写+合规审核二合一,从源头规避搬运违规;
高度自定义扩展:支持替换任意第三方AI、语音、数字人接口,适配不同预算创作者;
低设备门槛:最低支持Android5.0老旧安卓机型,运行流畅不卡顿。

使用方法
步骤1:安装部署
方式A(普通用户):项目Release页面下载编译完成APK,安卓手机允许未知来源安装;
方式B(开发者):GitHub拉取koubo-app源码,配置Flutter环境本地打包APK。
步骤2:基础配置(首次打开)
进入设置页,填入所需服务API密钥(大模型、数字人API可选填,免费TTS无需密钥),保存后自动加密存储。
步骤3:文案创作
首页粘贴短视频链接,点击「提取文案」自动抓取脚本;
点击AI改写,选择改写风格,生成多版原创文案;
运行合规检测,修改标记违规词语,定稿保存。
步骤4:生成配音音频
选中定稿文案,切换音色/调整语速,一键生成配音,预览音频后保存本地。
步骤5:数字人视频产出
上传人像照片,绑定生成好的配音音频,提交生成数字人口播视频,完成后本地保存,直接发布短视频平台。
收费价格
1. 软件本体:永久免费
开源项目本身无任何订阅、买断费用,全部基础功能无阉割开放使用,无广告弹窗。
2. 配套第三方API按需自费(软件不抽成)
软件仅提供接入通道,收费由对应服务商收取,口播智能体不参与分成:
Edge-TTS:完全免费,无需充值,新手零成本配音;
第三方大模型(DeepSeek、GPT、Claude等):按Token按量计费;
CosyVoice声音克隆、飞影数字人视频:服务商按生成次数/包月收费,用户自主选购套餐。
3. 无强制消费门槛
仅使用内置免费TTS,即可完成文案、配音全流程,仅数字人视频需要第三方API额度。

常见问题解答(FAQ)
Q1:苹果iOS手机可以使用吗?
A:当前项目基于Flutter优先适配Android,暂无iOS安装包,苹果用户可使用安卓设备或电脑模拟器运行。
Q2:开源代码可以商用二次开发吗?
A:遵循仓库开源协议,个人、自媒体、小型企业均可商用二次修改、打包分发,禁止倒卖源码牟利。
Q3:提取同行视频文案会侵权吗?
A:工具仅做文本提取,AI多重改写后生成原创脚本,搭配合规检测可大幅降低侵权风险,建议改写后自主调整内容再发布。
Q4:API密钥存在手机里安全吗?
A:采用系统级加密存储,密钥不会明文保存,软件不会上传密钥至任何服务器,仅本地调用第三方接口时临时传输。
Q5:数字人生成失败是什么原因?
A:多为数字人API余额不足、网络波动、人像照片模糊,检查密钥余额与网络后重新提交即可。
Q6:老旧安卓手机能正常运行吗?
A:最低适配Android5.0,内存2G以上即可流畅使用,低配机型仅数字人视频生成速度会稍慢。
Q7:软件会自动上传我的文案、照片素材吗?
A:不会,所有素材仅存储本机本地,只有主动提交数字人生成时,人像图片会临时传输至对应数字人服务商接口。
Q8:可以不用数字人功能,只做文案和配音吗?
A:完全可以,数字人为可选模块,不填写数字人API密钥不影响文案改写、免费配音全部功能。
总结
口播智能体是一款面向自媒体人的开源轻量化安卓AI短视频工具,核心解决口播博主文案原创、合规风控、配音出镜三大创作痛点。相比同类闭源付费剪辑软件,它具备永久免费、本地隐私存储、高度自定义接口、低设备门槛四大核心优势,内置免费语音合成降低新手创作成本,一站式串联文案改写、合规检测、配音、数字人视频全链路。
普通短视频创作者可直接下载APK开箱即用,开发者可拉取源码自由定制功能;预算有限博主仅依靠内置免费TTS就能完成脚本配音,有批量起号需求的自媒体团队可搭配第三方数字人API实现批量短视频生产,是兼顾实用性、隐私安全与性价比的开源口播创作解决方案。
口播智能体下载地址
版权与来源声明:AI铺子提供的口播智能体电脑客户端/APP,均转载自官方下载网站或经授权的可信分发渠道。相关软件的所有权、版权及知识产权均归原作者所有。本站不对任何软件进行二次修改或附加捆绑,确保文件的原始性与完整性。我们强烈建议用户支持正版软件,并通过官方渠道获取口播智能体最新版本和专业技术支持。
