AI Video Workflow: 全自动 AI 原生视频生成工作流

简体中文 | English

AI Video Workflow 是一款免费、开源的桌面应用程序，它将多个顶尖的AI模型（文生图、图生视频、文生音乐）串联成一个全自动的AI原生视频创作流水线。

你是否想创作引人注目的AI短视频，却被繁琐的平台切换、复杂的参数调整和枯竭的创作灵感所困扰？本项目旨在将AI视频创作的整个过程简化为几次点击，让任何人都能轻松生成具有独特视觉风格和定制化配乐的短视频。

(点击图片跳转到 B 站观看高清演示视频)

✨ 核心功能

这不仅是一个工具，更是一个完整的 AIGC 创作生态系统：

🤖 全自动AI创作流水线:
- 文生图 (Text-to-Image): 对接 LibLibAI 平台，支持丰富的 Checkpoint、LoRA 模型和参数，将您的想法变为精美图像。
- 图生视频 (Image-to-Video): 调用火山引擎 即梦（Jimeng）I2V 模型，为静态图片赋予生命，生成平滑自然的动态视频。
- 文生音乐 (Text-to-Music): 接入火山引擎 即梦（Jimeng）音乐 模型，通过文本描述（如风格、情绪、乐器）即可生成独一无二的背景音乐。
- 自动合成 (Automatic Merging): 使用强大的 FFmpeg 引擎，将生成的视频画面与背景音乐无缝合成为最终的成品视频。
💡 AI驱动的灵感引擎:
- 内置基于 豆包（Doubao）大模型 的提示词生成器。
- 提供“美女”、“Labubu”等多种预设主题，只需勾选想要的风格（如“沙滩”、“健身房”或“糖果系”、“魔法系”），即可一键生成全套专业的图片、音乐提示词和爆款标题、标签。
🎨 直观的图形化界面 (GUI):
- 三步式工作流: 清晰地将创作过程分为“文生图 → 图生视频 → 文生音乐与合成”三个阶段，每一步的进展和结果都一目了然。
- 集中式参数管理: 在统一的界面中配置所有AI模型的参数，无需在多个网页或应用间切换。
- 实时媒体预览: 生成的图片和视频会直接在界面中展示和播放，方便您即时评估效果。
- 历史记录与导航: 支持在多张生成的图片之间轻松切换，方便您选择最满意的一张进入下一步。

📸 软件截图

软件主界面：提示词生成部分。

软件主界面：图像参数部分。

生成示例：生成图像。

生成示例：最终视频。

🚀 快速开始

系统要求

Python: 3.8 或更高版本。
FFmpeg: 必须安装 FFmpeg 并将其添加到系统环境变量中。
- 请访问 FFmpeg 官网查看安装教程。
- 检查是否安装成功：打开终端或命令提示符，输入 ffmpeg -version。
API Keys:
- 豆包（Doubao） API Key: 用于提示词生成。
- LibLibAI Access Key & Secret Key: 用于文生图。
- 火山引擎（即梦）Access Key & Secret Key: 用于图生视频和文生音乐。

安装与启动

克隆本仓库：

git clone https://github.com/toki-plus/ai-video-workflow.git
cd ai-video-workflow

创建并激活虚拟环境 (推荐)：

python -m venv venv
# Windows 系统
venv\Scripts\activate
# macOS/Linux 系统
source venv/bin/activate

安装依赖库：
```
pip install -r requirements.txt
```
配置 API Keys:
- 强烈建议通过设置系统环境变量来配置密钥，程序会自动读取：
  - DOUBAO_API_KEY
  - LIBLIB_AK, LIBLIB_SK
  - JIMENG_AK, JIMENG_SK
- 或者，您也可以在软件启动后，在 "API 密钥" 标签页中手动输入。
运行程序：
```
python ai_video_workflow.py
```

📖 使用指南

第一步：配置与准备
- 启动软件，在左侧的 "API 密钥" 标签页中确认所有密钥已填写正确，点击“保存当前参数”应用。
- 切换到 "提示词生成" 标签页，选择一个您感兴趣的主题（如“美女”），勾选几个场景，然后点击“生成提示词”。
- 在下方生成的表格中，选择最喜欢的一行，点击“应用选中行提示词”。
第二步：文生图
- 参数会自动填充到“图像参数”和“音视频参数”标签页，您也可以手动修改。
- 在右侧工作流面板，点击“开始生成图片”。等待片刻，生成的图片将显示在预览区。
- 您可以多次生成，并通过“上一张”/“下一张”按钮选择最满意的图片。
第三步：图生视频
- 确认已选中满意的图片后，点击“生成视频”。程序会将该图片发送到AI模型进行处理。
- 处理完成后，生成的无声视频会自动在预览区循环播放。
第四步：文生音乐与合成
- 点击“合成最终视频”。程序将使用“音视频参数”中的音乐提示词生成配乐，并与视频合并。
- 任务完成后，最终的带配乐视频将在预览区播放，并保存在 output 文件夹中。
完成！
- 点击“全部重来”可以清空当前状态，开始一次全新的创作。

技术交流，请添加：

_个人微信
_{微信号: toki-plus (请备注“GitHub 定制”)}

_公众号
_{获取最新技术分享与项目更新}

📂 我的其他开源项目

Auto USPS Tracker: 专为跨境电商卖家设计的高效USPS批量物流追踪器，支持防屏蔽抓取并生成精美Excel报告。
AI Mixed Cut: 一款颠覆性的AI内容生产工具，通过“解构-重构”模式将爆款视频解构成创作素材库，并全自动生成全新原创视频。
AI Highlight Clip: 一款AI驱动的智能剪辑工具，能够全自动地从长视频中分析、发现并剪辑出多个“高光时刻”短视频，并自动生成爆款标题。
AI TTV Workflow: 一款AI驱动的文本转视频工具，能将任意文案自动转化为带有配音、字幕和封面的短视频，支持AI文案提取、二创和翻译。
Video Mover: 一个强大的、全自动化的内容创作流水线工具。它可以自动监听、下载指定的博主发布的视频，进行深度、多维度的视频去重处理，并利用AI大模型生成爆款标题，最终自动发布到不同平台。
AB Video Deduplicator: 通过创新的“高帧率抽帧混合”技术，从根本上重构视频数据指纹，以规避主流短视频平台的原创度检测和查重机制。

🤝 参与贡献

欢迎任何形式的贡献！如果你有新的功能点子、发现了Bug，或者有任何改进建议，请：

提交一个 Issue 进行讨论。
Fork 本仓库并提交 Pull Request。

如果这个项目对你有帮助，请不吝点亮一颗 ⭐！

📜 开源协议

本项目基于 MIT 协议开源。详情请见 LICENSE 文件。

Name		Name	Last commit message	Last commit date
Latest commit History 18 Commits
assets		assets
LICENSE		LICENSE
README.md		README.md
README_en.md		README_en.md
ai-video-workflow.py		ai-video-workflow.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

AI Video Workflow: 全自动 AI 原生视频生成工作流

✨ 核心功能

📸 软件截图

🚀 快速开始

系统要求

安装与启动

📖 使用指南

📂 我的其他开源项目

🤝 参与贡献

📜 开源协议

About

Uh oh!

Releases

Packages

Languages

License

toki-plus/ai-video-workflow

Folders and files

Latest commit

History

Repository files navigation

AI Video Workflow: 全自动 AI 原生视频生成工作流

✨ 核心功能

📸 软件截图

🚀 快速开始

系统要求

安装与启动

📖 使用指南

📂 我的其他开源项目

🤝 参与贡献

📜 开源协议

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages