AI Youtube Shorts Generator

2025-07-24AI视频 / 智能切片2131 次浏览

综合介绍

AI-Youtube-Shorts-Generator 是一个使用Python语言编写的开源工具，它的主要功能是自动化地将一个完整的YouTube长视频，转换成一个或多个适合发布的YouTube短视频（Shorts）。这个过程利用了多种人工智能技术。首先，它会下载用户提供的YouTube视频链接，然后使用OpenAI的Whisper模型将视频中的语音转换成文字稿。接着，它借助GPT-4模型分析文字稿，找出其中最有趣和最吸引人的“精华”片段。工具还能检测视频中的主要说话人，并使用计算机视觉技术（OpenCV）将画面裁剪成垂直的竖屏格式，这正是YouTube Shorts所要求的。最后，它把这些处理好的片段合成为最终的短视频。对于想要快速、批量地从现有长视频内容中创建短视频的内容创作者来说，这是一个可以提高效率的工具。

功能列表

视频下载: 仅需提供一个YouTube视频网址，工具即可自动下载该视频文件。
智能转录: 集成OpenAI的Whisper模型，能够将视频中的语音内容准确地转换成文字稿。
精华提取: 利用GPT-4的自然语言理解能力，分析转录后的文字稿，自动识别并提取出视频中最具吸引力和互动性的部分作为亮点。
说话人检测: 通过算法分析视频画面，自动检测并聚焦于正在说话的人物。
垂直裁剪: 使用OpenCV计算机视觉库，将识别出的精华片段自动裁剪为9:16的垂直分辨率，以适应YouTube Shorts的播放格式。
自动化处理: 将以上所有步骤串联起来，实现从视频下载到最终短视频生成的一键式自动化流程。

使用帮助

这个工具的设计目的是帮助用户从一个长视频中，通过AI自动分析并剪辑出适合发布为YouTube Shorts的短视频。以下是详细的安装和使用流程，可以帮助你从零开始运行这个工具。

前期准备 (Prerequisites)

在开始安装之前，你需要确保你的电脑上已经安装了以下几个软件：

Python: 需要 3.7 或更高版本。你可以在命令行中输入 python --version 或 python3 --version 来检查你的Python版本。
FFmpeg: 这是一个处理视频和音频的强大工具。程序在后台会调用它来对视频进行裁剪和拼接。你需要从其官网下载并将其安装在你的操作系统中，同时确保它的路径已经添加到了系统环境变量里，这样程序才能在任何路径下调用它。
OpenCV: 这是一个计算机视觉库，本工具用它来处理视频帧和识别人脸。在安装Python依赖时，它会自动安装。
OpenAI API密钥: 这个工具的核心功能——分析文本并提取亮点，是由GPT-4模型完成的。你需要拥有一个OpenAI账户，并生成一个API密钥（API Key）。

安装步骤

请按照以下步骤在你的电脑上部署此工具：

1. 克隆代码仓库首先，你需要把项目的代码从GitHub上复制到你的本地电脑。打开命令行工具（在Windows上是CMD或PowerShell，在macOS或Linux上是Terminal），然后输入以下命令：

git clone https://github.com/SamurAIGPT/AI-Youtube-Shorts-Generator.git

这个命令会创建一个名为 AI-Youtube-Shorts-Generator 的文件夹，里面包含了所有的源代码。接着，进入这个新创建的文件夹：

cd AI-Youtube-Shorts-Generator

2. 创建并激活虚拟环境为了不和你电脑上其他的Python项目产生冲突，建议创建一个独立的Python“虚拟环境”。这个环境只为本项目服务。

运行以下命令来创建一个名为 venv 的虚拟环境：
```
python3 -m venv venv
```
创建完成后，你需要激活它。
- 在 Windows 系统上，运行：
```
venv\Scripts\activate
```
- 在 macOS 或 Linux 系统上，运行：
```
source venv/bin/activate
```
激活成功后，你会在命令行提示符的前面看到 (venv) 的字样。

3. 安装Python依赖包项目所需要的所有Python库都记录在 requirements.txt 文件中。在激活虚拟环境后，运行以下命令来自动安装所有必需的库：

pip install -r requirements.txt

这个过程可能需要一些时间，它会自动下载并安装如OpenCV、OpenAI等库。

4. 设置环境变量为了让程序能够使用OpenAI的GPT-4服务，你需要将你的API密钥配置好。

在项目的根目录（AI-Youtube-Shorts-Generator 文件夹内）中，手动创建一个名为 .env 的文件。
用文本编辑器打开这个新建的 .env 文件，在里面添加以下内容：
```
OPENAI_API=your_openai_api_key_here
```
请将 your_openai_api_key_here 替换成你自己的真实OpenAI API密钥。保存并关闭文件。

如何使用

完成以上所有安装和配置步骤后，你就可以开始使用了。

确保你的命令行终端依然处于项目文件夹内，并且虚拟环境 (venv) 是激活状态。
确保你的 .env 文件已经正确配置了API密钥。
运行主程序：
```
python main.py
```
程序启动后，它会在命令行里提示你输入一个YouTube视频的URL。你只需找到一个你想处理的长视频，复制它的网址，然后粘贴到命令行里并按下回车。
之后，程序会自动开始执行所有任务，包括下载视频、转录音频、分析内容、提取和裁剪精华片段。这个过程会花费一些时间，具体取决于原视频的长度和你的网络速度。
处理完成后，生成的短视频文件会保存在项目的文件夹中。

应用场景

内容创作者对于在YouTube等平台发布视频的博主，这个工具可以极大地提高工作效率。他们可以将已经发布过的长视频（例如深度评测、教程、访谈或直播录像）重新利用，快速生成多个短视频，用于在YouTube Shorts、TikTok或Instagram Reels上吸引新观众，或为旧内容引流。
播客和演讲者可以将完整的播客录像或演讲视频输入此工具，AI会自动提取出其中最有见地、最有趣或最富争议性的观点，并将其制作成独立的短视频。这有助于将核心思想以更易于传播的形式分享出去。
数字营销人员营销团队可以利用这个工具，从产品介绍视频、用户评价视频或网络研讨会录像中，快速剪辑出具有吸引力的广告片段或宣传短片，用于社交媒体营销活动，以更低的成本覆盖更广泛的潜在客户。
AI技术爱好者和开发者对于学习Python和AI技术的开发者来说，这是一个很好的实践项目。通过研究其源代码，可以具体了解如何综合运用GPT-4、Whisper、OpenCV等多种AI技术来解决一个真实世界的问题。

QA

这个工具是完全免费的吗？这个工具的源代码是开源且免费的，你可以自由下载和使用。但是，它依赖OpenAI的GPT-4和Whisper服务来分析视频内容，这些是付费服务。因此，在使用过程中，你的OpenAI账户会根据API的调用量产生费用。
我需要什么样的电脑配置才能运行它？这个工具主要消耗的是CPU和网络资源，对显卡没有特殊要求。视频处理（特别是FFmpeg转码）会比较消耗CPU性能。一个普通配置的现代计算机应该都可以运行，但更强的CPU会缩短视频处理的时间。
生成的短视频可以进行二次编辑吗？可以。工具最终生成的是标准的视频文件（如MP4格式）。你可以使用任何视频编辑软件，对这些AI生成的短视频进行进一步的修改，例如添加更复杂的字幕、特效或手动调整剪辑点。
这个工具支持中文视频吗？支持。工具使用的Whisper模型在识别多种语言（包括中文）方面表现非常出色，因此它可以很好地转录中文视频的语音内容。同时，GPT-4也能理解并处理中文文本，从而提取出中文视频的亮点。