口播智能体 (短视频 AI 数字人创作工具)

  • 软件版本:8.0.0
  • 软件类型:视频软件
  • 软件语言:简体中文
  • 运行环境:Android
  • 软件大小:57 MB
  • 发布时间:

口播智能体是什么

口播智能体是开源免费Flutter开发的安卓端短视频一站式AI创作工具,面向短视频博主、知识博主、带货达人、自媒体从业者打造,完整打通提取同行文案→AI原创改写→合规违禁词检测→AI配音/声音克隆→照片生成数字人口播视频全流程,无需电脑剪辑,手机端独立完成整条口播短视频制作,底层采用本地加密存储用户密钥与创作素材,支持自定义接入各类大模型、TTS语音、数字人视频API,无强制内置付费,是轻量化、隐私优先的开源短视频口播生产工具。

口播智能体区别于市面上闭源收费剪辑工具,核心优势为开源本地部署、自带免费TTS、自带法务审核、数字人一键生成

  1. 底层开发:基于Flutter 3.x全Dart开发,跨端适配安卓,状态管理采用Riverpod,本地数据库sqflite存储全部文案、音频、视频记录,API密钥通过flutter_secure_storage加密保存,不会上传隐私密钥至第三方服务器;

  2. 核心业务逻辑:解决自媒体三大痛点:同行文案搬运违规、人工配音耗时、真人出镜拍摄成本高。仅需粘贴短视频链接即可抓取原文,AI多重改写实现原创去重,内置违禁词库规避平台限流、广告法违规风险,搭配免费语音合成生成自然口播音频,上传单张人像照片即可调用数字人API生成对口型口播短片;

  3. 使用模式:双模式运行,一是直接下载编译好的APK安装即用,二是开发者可拉取GitHub源码本地自定义二次开发,自由替换AI模型、语音接口、数字人服务商;

  4. 适用场景:抖音/快手/视频号知识口播、好物带货、科普解说、财经分享、门店本地宣传、知识IP批量起号。

口播智能体 (短视频 AI 数字人创作工具)

软件功能

1. 短视频文案提取与AI改写

  • 粘贴短视频链接自动抓取完整口播脚本,支持本地文本手动导入;

  • 6种改写模式:同义润色、口语化改编、扩写、精简缩句、风格切换、批量去重;

  • 一次性生成3版差异化文案,AI自动打分排序,快速筛选高原创度脚本;

  • 自动生成配套短视频标题、热门话题标签。

2. 法务合规违禁词审核

  • 双重检测机制:内置广告法/平台敏感词词库过滤 + 大模型深度内容风险筛查;

  • 一键标记违规词汇,提供替换建议,降低限流、下架、扣分风险;

  • 支持自定义新增行业专属敏感词,适配电商、医疗、财经等特殊领域。

3. AI语音合成&声音克隆

  • 内置免费Edge-TTS,海量男女音色、方言、朗读语速自由调节;

  • 支持CosyVoice高品质音色,自定义录制样本完成个人声音克隆;

  • 音频导出保存本地,支持裁剪、分段、循环播放预览。

4. 照片数字人口播视频生成

  • 上传单张人像照片,输入配音文案一键生成同步口型数字人短片;

  • 依托飞影数字人API驱动,匹配语音自动生成眨眼、微笑微表情;

  • 视频本地缓存保存,支持直接分享至短视频平台。

5. 素材本地管理中心

  • 文案、音频、数字人视频分栏归档,关键词快速检索;

  • 批量删除、导出、备份全部创作素材;

  • 缓存清理功能,释放手机存储空间。

6. 自定义API配置中心

  • 自由填入大模型、TTS、数字人服务商密钥;

  • 多套密钥分组保存,一键切换服务商;

  • 密钥加密本地存储,杜绝隐私泄露。

软件特色

  1. 完全开源免费无捆绑:开源项目,无内置广告、无强制会员,个人商用均可免费使用,源码可自主修改;

  2. 隐私本地优先:文案、录音、API密钥全部存在手机本地,不强制上传云端,不存在内容泄露风险;

  3. 轻量化手机独立创作:无需电脑、无需专业剪辑软件,一部安卓手机完成完整口播视频生产;

  4. 自带免费配音能力:内置Edge免费语音合成,新手无需额外充值语音接口;

  5. 原创风控一体化:改写+合规审核二合一,从源头规避搬运违规;

  6. 高度自定义扩展:支持替换任意第三方AI、语音、数字人接口,适配不同预算创作者;

  7. 低设备门槛:最低支持Android5.0老旧安卓机型,运行流畅不卡顿。

口播智能体 (短视频 AI 数字人创作工具)

使用方法

步骤1:安装部署

方式A(普通用户):项目Release页面下载编译完成APK,安卓手机允许未知来源安装;
方式B(开发者):GitHub拉取koubo-app源码,配置Flutter环境本地打包APK。

步骤2:基础配置(首次打开)

进入设置页,填入所需服务API密钥(大模型、数字人API可选填,免费TTS无需密钥),保存后自动加密存储。

步骤3:文案创作

  1. 首页粘贴短视频链接,点击「提取文案」自动抓取脚本;

  2. 点击AI改写,选择改写风格,生成多版原创文案;

  3. 运行合规检测,修改标记违规词语,定稿保存。

步骤4:生成配音音频

选中定稿文案,切换音色/调整语速,一键生成配音,预览音频后保存本地。

步骤5:数字人视频产出

上传人像照片,绑定生成好的配音音频,提交生成数字人口播视频,完成后本地保存,直接发布短视频平台。

收费价格

1. 软件本体:永久免费

开源项目本身无任何订阅、买断费用,全部基础功能无阉割开放使用,无广告弹窗。

2. 配套第三方API按需自费(软件不抽成)

软件仅提供接入通道,收费由对应服务商收取,口播智能体不参与分成:

  1. Edge-TTS:完全免费,无需充值,新手零成本配音;

  2. 第三方大模型(DeepSeek、GPT、Claude等):按Token按量计费;

  3. CosyVoice声音克隆、飞影数字人视频:服务商按生成次数/包月收费,用户自主选购套餐。

3. 无强制消费门槛

仅使用内置免费TTS,即可完成文案、配音全流程,仅数字人视频需要第三方API额度。

口播智能体 (短视频 AI 数字人创作工具)

常见问题解答(FAQ)

Q1:苹果iOS手机可以使用吗?

A:当前项目基于Flutter优先适配Android,暂无iOS安装包,苹果用户可使用安卓设备或电脑模拟器运行。

Q2:开源代码可以商用二次开发吗?

A:遵循仓库开源协议,个人、自媒体、小型企业均可商用二次修改、打包分发,禁止倒卖源码牟利。

Q3:提取同行视频文案会侵权吗?

A:工具仅做文本提取,AI多重改写后生成原创脚本,搭配合规检测可大幅降低侵权风险,建议改写后自主调整内容再发布。

Q4:API密钥存在手机里安全吗?

A:采用系统级加密存储,密钥不会明文保存,软件不会上传密钥至任何服务器,仅本地调用第三方接口时临时传输。

Q5:数字人生成失败是什么原因?

A:多为数字人API余额不足、网络波动、人像照片模糊,检查密钥余额与网络后重新提交即可。

Q6:老旧安卓手机能正常运行吗?

A:最低适配Android5.0,内存2G以上即可流畅使用,低配机型仅数字人视频生成速度会稍慢。

Q7:软件会自动上传我的文案、照片素材吗?

A:不会,所有素材仅存储本机本地,只有主动提交数字人生成时,人像图片会临时传输至对应数字人服务商接口。

Q8:可以不用数字人功能,只做文案和配音吗?

A:完全可以,数字人为可选模块,不填写数字人API密钥不影响文案改写、免费配音全部功能。

总结

口播智能体是一款面向自媒体人的开源轻量化安卓AI短视频工具,核心解决口播博主文案原创、合规风控、配音出镜三大创作痛点。相比同类闭源付费剪辑软件,它具备永久免费、本地隐私存储、高度自定义接口、低设备门槛四大核心优势,内置免费语音合成降低新手创作成本,一站式串联文案改写、合规检测、配音、数字人视频全链路。

普通短视频创作者可直接下载APK开箱即用,开发者可拉取源码自由定制功能;预算有限博主仅依靠内置免费TTS就能完成脚本配音,有批量起号需求的自媒体团队可搭配第三方数字人API实现批量短视频生产,是兼顾实用性、隐私安全与性价比的开源口播创作解决方案。

口播智能体下载地址

安装形式 安装版
更新时间
软件语言 简体中文
立即下载
THE END