OpenShorts:开源AI短视频全链路生成工具,自托管无水印批量创作

原创 发布日期:
68

OpenShorts是什么

OpenShorts是一款免费开源的一站式AI视频制作SaaS平台,由mutonby团队开发,基于MIT许可证开源,主打“长视频转短视频+AI数字人生成+YouTube全流程运营”三大核心能力,支持Docker Compose一键自托管部署,全程无水印、无生成数量限制、无功能阉割,专为TikTok、Instagram Reels、YouTube Shorts等短视频平台内容创作打造。

作为开源项目,OpenShorts彻底打破传统AI视频工具的付费订阅、水印强制、功能受限等痛点,将视频剪辑、AI生成、配音字幕、多平台发布等功能全部整合,让个人创作者、中小商家、营销团队无需专业技能和高额成本,即可批量制作高质量短视频。

OpenShorts:开源AI短视频全链路生成工具,自托管无水印批量创作

功能特色

OpenShorts核心功能分为三大模块,覆盖短视频创作全流程,同时附加社交发布、UGC图库等实用功能,每一项功能均由AI驱动,操作极简且效果专业。

1. Clip Generator(长视频智能剪辑器)

核心能力是将YouTube长视频或本地视频文件,自动转化为9:16竖屏爆款短视频,全程AI自动化处理,无需手动剪辑。

  • 爆款片段智能识别:基于Google Gemini 3.0 Flash分析视频字幕和场景,自动筛选3-15个高传播潜力片段,时长控制在15-60秒,精准匹配短视频平台用户观看习惯。

  • 双模式AI竖屏重构

    • TRACK模式:MediaPipe人脸检测+YOLOv8目标追踪,搭配“重型三脚架”稳定引擎,适合单人出镜场景,画面稳定不抖动。

    • GENERAL模式:模糊背景智能布局,适配多人、风景、产品展示等复杂场景,无需手动调整画面。

  • 全自动字幕生成:集成faster-whisper模型,CPU优化运行,生成词级精准时间戳字幕,支持自定义字体、颜色、样式,自动嵌入视频。

  • 多语言AI配音:对接ElevenLabs语音引擎,支持30+语言配音,可选择男女声、不同音色,还支持声音克隆,一键生成专业旁白。

  • 钩子文本与特效叠加:AI自动生成吸睛钩子文本浮层,同时通过Gemini生成FFmpeg滤镜指令,添加转场、调色、动态特效,提升视频质感。

2. AI Shorts(AI数字人UGC视频生成器)

无需拍摄场地、网红演员、专业设备,一键生成AI数字人营销短视频,适配产品推广、品牌宣传、本地商家引流等场景。

  • 多方式内容输入:支持手动输入产品/服务描述,或直接输入网页URL,系统自动爬取信息并全网调研,精准提炼核心卖点。

  • 爆款脚本AI生成:自动生成“钩子-问题-解决方案-行动号召(CTA)”结构的短视频脚本,符合短视频平台传播逻辑,提升用户转化率。

  • AI数字人定制生成:基于Flux 2 Pro生成专属AI数字人,支持自定义外貌、服装、表情,也可从共享图库直接选择,无需从零创作。

  • 唇形精准同步:Hailuo 2.3 Fast生成数字人说话视频,搭配VEED唇形同步技术,确保口型与旁白完全匹配,自然逼真无违和感。

  • 低成本批量生成:两种成本模式可选,低成本版约0.65美元/视频,高端版约2美元/视频,远低于真人拍摄和商业AI工具成本。

3. YouTube Studio(YouTube全流程运营工具)

内置免费AI驱动的YouTube运营套件,覆盖视频发布前的素材优化到一键上线全流程,助力创作者提升YouTube流量与曝光。

  • AI缩略图生成:自动生成高吸引力视频缩略图,支持人脸叠加、文字标注、色彩优化,提升点击率。

  • 爆款标题批量推荐:一次性生成10个高热度标题建议,支持对话式优化,贴合YouTube算法偏好。

  • 结构化描述自动生成:生成带章节时间戳、关键词标签、引流话术的视频描述,适配SEO优化,提升搜索排名。

  • 一键发布上线:完成素材优化后,直接一键发布到YouTube,无需跳转第三方工具。

4. 附加实用功能

  • 社交自动发布:支持一键同步发布到TikTok、Instagram Reels、YouTube Shorts三大主流短视频平台,支持定时发布,提前规划内容日历,无需手动逐个平台上传。

  • UGC视频公共图库:内置/gallery图库页面,所有生成的视频、AI数字人均存储于此,支持悬停播放,同时适配SEO优化,生成单视频SEO页面(/video/{id})和JSON-LD结构化数据,提升搜索引擎收录率。

  • S3云备份:剪辑过程文件存储于私有S3桶,图库、数字人素材存储于公共S3桶,自动备份,防止数据丢失,同时支持跨设备访问。

OpenShorts:开源AI短视频全链路生成工具,自托管无水印批量创作

技术细节

OpenShorts采用前后端分离架构,核心依赖AI大模型、视频处理工具、计算机视觉框架,技术栈成熟且开源可定制,支持开发者二次开发和功能扩展。

1. 核心技术栈

  • 前端:React框架开发,搭配Remotion实现视频渲染和动态效果,界面简洁易用,支持响应式布局,适配电脑、平板等设备访问。

  • 后端:FastAPI高性能异步框架,处理AI请求、视频处理、数据存储等核心逻辑,支持高并发访问,响应速度快。

  • 视频处理核心:FFmpeg,负责视频裁剪、拼接、格式转换、特效添加等全流程处理,支持几乎所有主流视频格式。

  • AI模型依赖

    • 大语言模型:Google Gemini 3.0 Flash,负责内容分析、脚本生成、特效指令生成。

    • 语音识别:faster-whisper,CPU优化,实现高精度字幕生成。

    • 语音合成:ElevenLabs,30+语言TTS,支持声音克隆。

    • 计算机视觉:MediaPipe(人脸检测)、YOLOv8(目标追踪),实现智能竖屏重构。

    • 图像生成:Flux 2 Pro(AI数字人生成)、Hailuo 2.3 Fast(数字人视频生成)。

2. 部署架构

  • 部署方式:Docker + Docker Compose一键部署,支持本地服务器、云服务器(阿里云、腾讯云、华为云等)自托管,部署流程极简,新手也能快速上手。

  • 环境依赖:最低配置4核CPU、8GB内存、100GB硬盘,支持Linux系统(Ubuntu 20.04+推荐),无需独立显卡,CPU即可流畅运行。

  • 目录结构

openshorts/
├── app/        # 后端核心逻辑(FastAPI)
│  ├── main.py     # 入口文件
│  ├── subtitles.py  # 字幕处理模块
│  ├── thumbnail.py  # 缩略图生成模块
│  └── translate.py   # 翻译模块
├── frontend/      # React前端代码
├── remotion/      # Remotion视频渲染配置
├── docker-compose.yml # Docker部署配置文件
└── .env         # 环境变量配置(API密钥、存储配置等)

3. 核心工作流(以Clip Generator为例)

  1. 上传长视频(本地文件/YouTube链接)→ 2. faster-whisper生成字幕 → 3. Gemini分析字幕筛选爆款片段 → 4. FFmpeg提取片段 → 5. MediaPipe/YOLOv8智能竖屏裁剪 → 6. AI字幕/配音/特效叠加 → 7. 预览确认 → 8. 导出视频/一键发布。

OpenShorts:开源AI短视频全链路生成工具,自托管无水印批量创作

应用场景

OpenShorts功能全面,适配个人创作、商业营销、品牌推广、本地引流等多类场景,覆盖短视频创作全需求,具体如下:

  • 自媒体个人创作:知识博主、娱乐博主、科普博主,可将长时长直播、讲座、访谈视频,快速剪辑为多个短视频,批量发布到多平台,提升账号更新频率和流量。

  • 电商产品推广:电商卖家可将产品详情页视频、测评视频,转化为竖屏短视频,或直接输入产品链接生成AI数字人带货视频,一键发布到TikTok/Instagram,吸引海外消费者购买。

  • 本地商家引流:餐饮、美容、健身、旅游等本地商家,无需拍摄团队,通过AI数字人生成门店环境、服务介绍、优惠活动短视频,发布到本地社交平台,提升门店曝光和到店率。

  • 品牌营销宣传:中小企业可批量生成品牌故事、产品卖点、客户案例短视频,统一发布到多平台,降低营销成本,扩大品牌影响力。

  • YouTube频道运营:YouTube创作者可通过内置Studio工具,快速优化视频标题、缩略图、描述,同时将长视频剪辑为短视频,多平台分发,实现流量闭环。

  • 教育知识科普:教育机构、知识博主可将长课程视频,拆解为知识点短视频,添加AI字幕和配音,适配碎片化学习场景,提升知识传播效率。

使用方法

OpenShorts支持Docker自托管部署在线体验两种方式,操作极简,无需专业技术,新手可快速上手,以下为详细步骤:

1. 环境准备

  • 服务器:Linux系统(Ubuntu 20.04+推荐),4核CPU、8GB内存、100GB硬盘以上配置。

  • 依赖安装:安装Docker和Docker Compose,命令如下:

# 安装Docker
sudo apt update && sudo apt install docker.io -y
# 安装Docker Compose
sudo apt install docker-compose -y
# 启动Docker服务
sudo systemctl start docker && sudo systemctl enable docker

2. 项目部署

  1. 克隆仓库代码:

git clone https://github.com/mutonby/openshorts.git
cd openshorts
  1. 配置环境变量:复制.env.example文件为.env,填写必要的API密钥(Gemini、ElevenLabs等)、S3存储配置、端口号等信息。

cp .env.example .env
# 编辑.env文件,填写配置
nano .env
  1. 一键启动服务:

docker-compose up -d
  1. 访问系统:浏览器输入http://服务器IP:端口号(默认端口8000),进入OpenShorts首页,开始使用。

3. 核心功能操作(以AI Shorts生成为例)

  1. 登录系统:首次使用注册账号,登录后进入控制台。

  2. 选择功能:点击导航栏“AI Shorts”,进入数字人视频生成页面。

  3. 输入内容:选择“手动输入”或“URL导入”,填写产品/服务描述,明确核心卖点和视频时长(15-60秒)。

  4. 生成脚本:点击“生成脚本”,AI自动生成爆款脚本,预览后可手动修改调整。

  5. 选择数字人:从共享图库选择AI数字人,或自定义生成专属数字人,选择性别、年龄、外貌风格。

  6. 设置配音:选择配音语言、音色,预览配音效果,确认后生成旁白音频。

  7. 生成视频:点击“生成视频”,系统自动合成数字人视频、字幕、B Roll素材、特效,等待5-10分钟生成完成。

  8. 预览导出:预览生成的视频,满意后导出本地保存,或一键发布到TikTok/Instagram/YouTube平台。

竞品对比

选取2款主流AI短视频工具(Runway Gen-4、Pika Labs)与OpenShorts从核心功能、部署方式、水印、成本、多平台发布5个维度对比,凸显OpenShorts开源免费、自托管、全链路的核心优势:

对比维度 OpenShorts Runway Gen-4 Pika Labs
核心功能 长视频剪辑+AI数字人生成+YouTube运营,全链路覆盖 AI视频生成+简单剪辑,无数字人模块 AI图像生成+短视频生成,无长视频剪辑
部署方式 开源自托管(Docker),本地/云服务器部署 云端SaaS,仅在线使用,无部署权限 云端SaaS,仅在线使用,无部署权限
水印 无水印,无生成数量限制 免费版强制水印,付费版去除水印 免费版强制水印,付费版去除水印
使用成本 完全免费(仅第三方API费用,约0.65-2美元/视频) 订阅制,$28/月起,生成次数受限 订阅制,$10/月起,生成次数受限
多平台发布 一键发布到TikTok/Instagram/YouTube,支持定时 仅支持导出视频,无一键发布功能 仅支持导出视频,无一键发布功能
定制化能力 开源可二次开发,自定义功能、界面、模型 闭源SaaS,无定制化权限 闭源SaaS,无定制化权限

OpenShorts:开源AI短视频全链路生成工具,自托管无水印批量创作

常见问题解答

Q:OpenShorts是否完全免费?

A:OpenShorts本身是开源免费的,无订阅费用、无水印、无生成数量限制。仅使用第三方AI服务(如Gemini、ElevenLabs)时,需支付少量API调用费用,成本可控。

Q:部署OpenShorts需要高配置服务器吗?

A:不需要独立显卡,最低4核CPU、8GB内存、100GB硬盘的Linux服务器即可流畅运行,个人服务器或低配云服务器均可部署,硬件门槛低。

Q:生成的AI数字人视频版权归谁所有?

A:用户通过OpenShorts生成的所有视频(含AI数字人视频、剪辑短视频),版权完全归用户所有,可自由用于商业推广、个人创作等场景,无版权纠纷风险。

Q:支持中文内容生成和中文字幕吗?

A:完全支持,OpenShorts适配中文场景,可生成中文脚本、中文字幕、中文AI配音,同时支持中文钩子文本和特效,适合国内创作者和商家使用。

Q:第三方API密钥安全吗?会泄露吗?

A:OpenShorts采用本地自托管部署,所有API密钥存储在用户自己的服务器.env文件中,不会上传到第三方服务器,数据完全由用户掌控,安全性高。

Q:生成视频的画质怎么样?支持高清导出吗?

A:生成视频默认1080P高清画质,帧率30fps,支持导出MP4格式,画质清晰稳定,字幕和配音同步流畅,完全满足短视频平台发布要求。

相关链接

总结

OpenShorts是一款极具性价比的开源AI短视频全链路生成平台,以免费开源、自托管部署、无水印无限制为核心亮点,整合长视频智能剪辑、AI数字人UGC视频生成、YouTube全流程运营三大核心功能,覆盖短视频创作从素材处理、内容生成到多平台发布的全流程需求,硬件门槛低、操作极简、成本可控,适配个人自媒体、电商卖家、本地商家、中小企业等多类用户场景,相比传统付费AI视频工具,既降低了短视频创作的技术门槛和经济成本,又保障了数据安全和版权归属,是目前开源领域中功能最全面、实用性最强的AI短视频工具之一。

打赏
THE END
作者头像
97ai
我不是在训练模型,而是在与未来的自己对话。