OpenShorts：开源AI短视频全链路生成工具，自托管无水印批量创作

AI新闻 97ai 3个月前

257

OpenShorts是什么

OpenShorts是一款免费开源的一站式AI视频制作SaaS平台，由mutonby团队开发，基于MIT许可证开源，主打“长视频转短视频+AI数字人生成+YouTube全流程运营”三大核心能力，支持Docker Compose一键自托管部署，全程无水印、无生成数量限制、无功能阉割，专为TikTok、Instagram Reels、YouTube Shorts等短视频平台内容创作打造。

作为开源项目，OpenShorts彻底打破传统AI视频工具的付费订阅、水印强制、功能受限等痛点，将视频剪辑、AI生成、配音字幕、多平台发布等功能全部整合，让个人创作者、中小商家、营销团队无需专业技能和高额成本，即可批量制作高质量短视频。

OpenShorts（图1）

功能特色

OpenShorts核心功能分为三大模块，覆盖短视频创作全流程，同时附加社交发布、UGC图库等实用功能，每一项功能均由AI驱动，操作极简且效果专业。

1. Clip Generator（长视频智能剪辑器）

核心能力是将YouTube长视频或本地视频文件，自动转化为9:16竖屏爆款短视频，全程AI自动化处理，无需手动剪辑。

爆款片段智能识别：基于Google Gemini 3.0 Flash分析视频字幕和场景，自动筛选3-15个高传播潜力片段，时长控制在15-60秒，精准匹配短视频平台用户观看习惯。
双模式AI竖屏重构：

TRACK模式：MediaPipe人脸检测+YOLOv8目标追踪，搭配“重型三脚架”稳定引擎，适合单人出镜场景，画面稳定不抖动。
GENERAL模式：模糊背景智能布局，适配多人、风景、产品展示等复杂场景，无需手动调整画面。

全自动字幕生成：集成faster-whisper模型，CPU优化运行，生成词级精准时间戳字幕，支持自定义字体、颜色、样式，自动嵌入视频。
多语言AI配音：对接ElevenLabs语音引擎，支持30+语言配音，可选择男女声、不同音色，还支持声音克隆，一键生成专业旁白。
钩子文本与特效叠加：AI自动生成吸睛钩子文本浮层，同时通过Gemini生成FFmpeg滤镜指令，添加转场、调色、动态特效，提升视频质感。

2. AI Shorts（AI数字人UGC视频生成器）

无需拍摄场地、网红演员、专业设备，一键生成AI数字人营销短视频，适配产品推广、品牌宣传、本地商家引流等场景。

多方式内容输入：支持手动输入产品/服务描述，或直接输入网页URL，系统自动爬取信息并全网调研，精准提炼核心卖点。
爆款脚本AI生成：自动生成“钩子-问题-解决方案-行动号召（CTA）”结构的短视频脚本，符合短视频平台传播逻辑，提升用户转化率。
AI数字人定制生成：基于Flux 2 Pro生成专属AI数字人，支持自定义外貌、服装、表情，也可从共享图库直接选择，无需从零创作。
唇形精准同步：Hailuo 2.3 Fast生成数字人说话视频，搭配VEED唇形同步技术，确保口型与旁白完全匹配，自然逼真无违和感。
低成本批量生成：两种成本模式可选，低成本版约0.65美元/视频，高端版约2美元/视频，远低于真人拍摄和商业AI工具成本。

3. YouTube Studio（YouTube全流程运营工具）

内置免费AI驱动的YouTube运营套件，覆盖视频发布前的素材优化到一键上线全流程，助力创作者提升YouTube流量与曝光。

AI缩略图生成：自动生成高吸引力视频缩略图，支持人脸叠加、文字标注、色彩优化，提升点击率。
爆款标题批量推荐：一次性生成10个高热度标题建议，支持对话式优化，贴合YouTube算法偏好。
结构化描述自动生成：生成带章节时间戳、关键词标签、引流话术的视频描述，适配SEO优化，提升搜索排名。
一键发布上线：完成素材优化后，直接一键发布到YouTube，无需跳转第三方工具。

4. 附加实用功能

社交自动发布：支持一键同步发布到TikTok、Instagram Reels、YouTube Shorts三大主流短视频平台，支持定时发布，提前规划内容日历，无需手动逐个平台上传。
UGC视频公共图库：内置/gallery图库页面，所有生成的视频、AI数字人均存储于此，支持悬停播放，同时适配SEO优化，生成单视频SEO页面（/video/{id}）和JSON-LD结构化数据，提升搜索引擎收录率。
S3云备份：剪辑过程文件存储于私有S3桶，图库、数字人素材存储于公共S3桶，自动备份，防止数据丢失，同时支持跨设备访问。

OpenShorts（图2）

技术细节

OpenShorts采用前后端分离架构，核心依赖AI大模型、视频处理工具、计算机视觉框架，技术栈成熟且开源可定制，支持开发者二次开发和功能扩展。

1. 核心技术栈

前端：React框架开发，搭配Remotion实现视频渲染和动态效果，界面简洁易用，支持响应式布局，适配电脑、平板等设备访问。
后端：FastAPI高性能异步框架，处理AI请求、视频处理、数据存储等核心逻辑，支持高并发访问，响应速度快。
视频处理核心：FFmpeg，负责视频裁剪、拼接、格式转换、特效添加等全流程处理，支持几乎所有主流视频格式。
AI模型依赖：

大语言模型：Google Gemini 3.0 Flash，负责内容分析、脚本生成、特效指令生成。
语音识别：faster-whisper，CPU优化，实现高精度字幕生成。
语音合成：ElevenLabs，30+语言TTS，支持声音克隆。
计算机视觉：MediaPipe（人脸检测）、YOLOv8（目标追踪），实现智能竖屏重构。
图像生成：Flux 2 Pro（AI数字人生成）、Hailuo 2.3 Fast（数字人视频生成）。

2. 部署架构

部署方式：Docker + Docker Compose一键部署，支持本地服务器、云服务器（阿里云、腾讯云、华为云等）自托管，部署流程极简，新手也能快速上手。
环境依赖：最低配置4核CPU、8GB内存、100GB硬盘，支持Linux系统（Ubuntu 20.04+推荐），无需独立显卡，CPU即可流畅运行。
目录结构：

openshorts/
├── app/        # 后端核心逻辑（FastAPI）
│  ├── main.py     # 入口文件
│  ├── subtitles.py  # 字幕处理模块
│  ├── thumbnail.py  # 缩略图生成模块
│  └── translate.py   # 翻译模块
├── frontend/      # React前端代码
├── remotion/      # Remotion视频渲染配置
├── docker-compose.yml # Docker部署配置文件
└── .env         # 环境变量配置（API密钥、存储配置等）

3. 核心工作流（以Clip Generator为例）

上传长视频（本地文件/YouTube链接）→ 2. faster-whisper生成字幕 → 3. Gemini分析字幕筛选爆款片段 → 4. FFmpeg提取片段 → 5. MediaPipe/YOLOv8智能竖屏裁剪 → 6. AI字幕/配音/特效叠加 → 7. 预览确认 → 8. 导出视频/一键发布。

OpenShorts（图3）

应用场景

OpenShorts功能全面，适配个人创作、商业营销、品牌推广、本地引流等多类场景，覆盖短视频创作全需求，具体如下：

自媒体个人创作：知识博主、娱乐博主、科普博主，可将长时长直播、讲座、访谈视频，快速剪辑为多个短视频，批量发布到多平台，提升账号更新频率和流量。
电商产品推广：电商卖家可将产品详情页视频、测评视频，转化为竖屏短视频，或直接输入产品链接生成AI数字人带货视频，一键发布到TikTok/Instagram，吸引海外消费者购买。
本地商家引流：餐饮、美容、健身、旅游等本地商家，无需拍摄团队，通过AI数字人生成门店环境、服务介绍、优惠活动短视频，发布到本地社交平台，提升门店曝光和到店率。
品牌营销宣传：中小企业可批量生成品牌故事、产品卖点、客户案例短视频，统一发布到多平台，降低营销成本，扩大品牌影响力。
YouTube频道运营：YouTube创作者可通过内置Studio工具，快速优化视频标题、缩略图、描述，同时将长视频剪辑为短视频，多平台分发，实现流量闭环。
教育知识科普：教育机构、知识博主可将长课程视频，拆解为知识点短视频，添加AI字幕和配音，适配碎片化学习场景，提升知识传播效率。

使用方法

OpenShorts支持Docker自托管部署和在线体验两种方式，操作极简，无需专业技术，新手可快速上手，以下为详细步骤：

1. 环境准备

服务器：Linux系统（Ubuntu 20.04+推荐），4核CPU、8GB内存、100GB硬盘以上配置。
依赖安装：安装Docker和Docker Compose，命令如下：

# 安装Docker
sudo apt update && sudo apt install docker.io -y
# 安装Docker Compose
sudo apt install docker-compose -y
# 启动Docker服务
sudo systemctl start docker && sudo systemctl enable docker

2. 项目部署

克隆仓库代码：

git clone https://github.com/mutonby/openshorts.git
cd openshorts

配置环境变量：复制.env.example文件为.env，填写必要的API密钥（Gemini、ElevenLabs等）、S3存储配置、端口号等信息。

cp .env.example .env
# 编辑.env文件，填写配置
nano .env

一键启动服务：

docker-compose up -d

访问系统：浏览器输入http://服务器IP:端口号（默认端口8000），进入OpenShorts首页，开始使用。

3. 核心功能操作（以AI Shorts生成为例）

登录系统：首次使用注册账号，登录后进入控制台。
选择功能：点击导航栏“AI Shorts”，进入数字人视频生成页面。
输入内容：选择“手动输入”或“URL导入”，填写产品/服务描述，明确核心卖点和视频时长（15-60秒）。
生成脚本：点击“生成脚本”，AI自动生成爆款脚本，预览后可手动修改调整。
选择数字人：从共享图库选择AI数字人，或自定义生成专属数字人，选择性别、年龄、外貌风格。
设置配音：选择配音语言、音色，预览配音效果，确认后生成旁白音频。
生成视频：点击“生成视频”，系统自动合成数字人视频、字幕、B Roll素材、特效，等待5-10分钟生成完成。
预览导出：预览生成的视频，满意后导出本地保存，或一键发布到TikTok/Instagram/YouTube平台。

竞品对比

选取2款主流AI短视频工具（Runway Gen-4、Pika Labs）与OpenShorts从核心功能、部署方式、水印、成本、多平台发布5个维度对比，凸显OpenShorts开源免费、自托管、全链路的核心优势：

对比维度	OpenShorts	Runway Gen-4	Pika Labs
核心功能	长视频剪辑+AI数字人生成+YouTube运营，全链路覆盖	AI视频生成+简单剪辑，无数字人模块	AI图像生成+短视频生成，无长视频剪辑
部署方式	开源自托管（Docker），本地/云服务器部署	云端SaaS，仅在线使用，无部署权限	云端SaaS，仅在线使用，无部署权限
水印	无水印，无生成数量限制	免费版强制水印，付费版去除水印	免费版强制水印，付费版去除水印
使用成本	完全免费（仅第三方API费用，约0.65-2美元/视频）	订阅制，$28/月起，生成次数受限	订阅制，$10/月起，生成次数受限
多平台发布	一键发布到TikTok/Instagram/YouTube，支持定时	仅支持导出视频，无一键发布功能	仅支持导出视频，无一键发布功能
定制化能力	开源可二次开发，自定义功能、界面、模型	闭源SaaS，无定制化权限	闭源SaaS，无定制化权限

OpenShorts（图4）

常见问题解答

Q：OpenShorts是否完全免费？

A：OpenShorts本身是开源免费的，无订阅费用、无水印、无生成数量限制。仅使用第三方AI服务（如Gemini、ElevenLabs）时，需支付少量API调用费用，成本可控。

Q：部署OpenShorts需要高配置服务器吗？

A：不需要独立显卡，最低4核CPU、8GB内存、100GB硬盘的Linux服务器即可流畅运行，个人服务器或低配云服务器均可部署，硬件门槛低。

Q：生成的AI数字人视频版权归谁所有？

A：用户通过OpenShorts生成的所有视频（含AI数字人视频、剪辑短视频），版权完全归用户所有，可自由用于商业推广、个人创作等场景，无版权纠纷风险。

Q：支持中文内容生成和中文字幕吗？

A：完全支持，OpenShorts适配中文场景，可生成中文脚本、中文字幕、中文AI配音，同时支持中文钩子文本和特效，适合国内创作者和商家使用。

Q：第三方API密钥安全吗？会泄露吗？

A：OpenShorts采用本地自托管部署，所有API密钥存储在用户自己的服务器.env文件中，不会上传到第三方服务器，数据完全由用户掌控，安全性高。

Q：生成视频的画质怎么样？支持高清导出吗？

A：生成视频默认1080P高清画质，帧率30fps，支持导出MP4格式，画质清晰稳定，字幕和配音同步流畅，完全满足短视频平台发布要求。

总结

OpenShorts是一款极具性价比的开源AI短视频全链路生成平台，以免费开源、自托管部署、无水印无限制为核心亮点，整合长视频智能剪辑、AI数字人UGC视频生成、YouTube全流程运营三大核心功能，覆盖短视频创作从素材处理、内容生成到多平台发布的全流程需求，硬件门槛低、操作极简、成本可控，适配个人自媒体、电商卖家、本地商家、中小企业等多类用户场景，相比传统付费AI视频工具，既降低了短视频创作的技术门槛和经济成本，又保障了数据安全和版权归属，是目前开源领域中功能最全面、实用性最强的AI短视频工具之一。

AI视频生成短视频生成 AI数字人开源项目

打赏

版权及免责申明：本文由@97ai原创发布。该文章观点仅代表作者本人，不代表本站立场。本站不承担任何相关法律责任。

如若转载，请注明出处：https://www.aipuzi.cn/ai-news/openshorts.html

THE END

97ai

我不是在训练模型，而是在与未来的自己对话。

+ 关注

OpenShorts：开源AI短视频全链路生成工具，自托管无水印批量创作

文章目录

OpenShorts是什么

功能特色

1. Clip Generator（长视频智能剪辑器）

2. AI Shorts（AI数字人UGC视频生成器）

3. YouTube Studio（YouTube全流程运营工具）

4. 附加实用功能

技术细节

1. 核心技术栈

2. 部署架构

3. 核心工作流（以Clip Generator为例）

应用场景

使用方法

1. 环境准备

2. 项目部署

3. 核心功能操作（以AI Shorts生成为例）

竞品对比

常见问题解答

相关链接

总结

OpenShorts：开源AI短视频全链路生成工具，自托管无水印批量创作

文章目录

OpenShorts是什么

功能特色

1. Clip Generator（长视频智能剪辑器）

2. AI Shorts（AI数字人UGC视频生成器）

3. YouTube Studio（YouTube全流程运营工具）

4. 附加实用功能

技术细节

1. 核心技术栈

2. 部署架构

3. 核心工作流（以Clip Generator为例）

应用场景

使用方法

1. 环境准备

2. 项目部署

3. 核心功能操作（以AI Shorts生成为例）

竞品对比

常见问题解答

相关链接

总结

相关文章