AI Youtube Shorts Generator
综合介绍
AI-Youtube-Shorts-Generator 是一个使用Python语言编写的开源工具,它的主要功能是自动化地将一个完整的YouTube长视频,转换成一个或多个适合发布的YouTube短视频(Shorts)。这个过程利用了多种人工智能技术。首先,它会下载用户提供的YouTube视频链接,然后使用OpenAI的Whisper模型将视频中的语音转换成文字稿。接着,它借助GPT-4模型分析文字稿,找出其中最有趣和最吸引人的“精华”片段。工具还能检测视频中的主要说话人,并使用计算机视觉技术(OpenCV)将画面裁剪成垂直的竖屏格式,这正是YouTube Shorts所要求的。最后,它把这些处理好的片段合成为最终的短视频。对于想要快速、批量地从现有长视频内容中创建短视频的内容创作者来说,这是一个可以提高效率的工具。
功能列表
- 视频下载: 仅需提供一个YouTube视频网址,工具即可自动下载该视频文件。
- 智能转录: 集成OpenAI的Whisper模型,能够将视频中的语音内容准确地转换成文字稿。
- 精华提取: 利用GPT-4的自然语言理解能力,分析转录后的文字稿,自动识别并提取出视频中最具吸引力和互动性的部分作为亮点。
- 说话人检测: 通过算法分析视频画面,自动检测并聚焦于正在说话的人物。
- 垂直裁剪: 使用OpenCV计算机视觉库,将识别出的精华片段自动裁剪为9:16的垂直分辨率,以适应YouTube Shorts的播放格式。
- 自动化处理: 将以上所有步骤串联起来,实现从视频下载到最终短视频生成的一键式自动化流程。
使用帮助
这个工具的设计目的是帮助用户从一个长视频中,通过AI自动分析并剪辑出适合发布为YouTube Shorts的短视频。以下是详细的安装和使用流程,可以帮助你从零开始运行这个工具。
前期准备 (Prerequisites)
在开始安装之前,你需要确保你的电脑上已经安装了以下几个软件:
- Python: 需要
3.7
或更高版本。你可以在命令行中输入python --version
或python3 --version
来检查你的Python版本。 - FFmpeg: 这是一个处理视频和音频的强大工具。程序在后台会调用它来对视频进行裁剪和拼接。你需要从其官网下载并将其安装在你的操作系统中,同时确保它的路径已经添加到了系统环境变量里,这样程序才能在任何路径下调用它。
- OpenCV: 这是一个计算机视觉库,本工具用它来处理视频帧和识别人脸。在安装Python依赖时,它会自动安装。
- OpenAI API密钥: 这个工具的核心功能——分析文本并提取亮点,是由GPT-4模型完成的。你需要拥有一个OpenAI账户,并生成一个API密钥(API Key)。
安装步骤
请按照以下步骤在你的电脑上部署此工具:
1. 克隆代码仓库首先,你需要把项目的代码从GitHub上复制到你的本地电脑。打开命令行工具(在Windows上是CMD或PowerShell,在macOS或Linux上是Terminal),然后输入以下命令:
git clone https://github.com/SamurAIGPT/AI-Youtube-Shorts-Generator.git
这个命令会创建一个名为 AI-Youtube-Shorts-Generator
的文件夹,里面包含了所有的源代码。接着,进入这个新创建的文件夹:
cd AI-Youtube-Shorts-Generator
2. 创建并激活虚拟环境为了不和你电脑上其他的Python项目产生冲突,建议创建一个独立的Python“虚拟环境”。这个环境只为本项目服务。
- 运行以下命令来创建一个名为
venv
的虚拟环境:python3 -m venv venv
- 创建完成后,你需要激活它。
- 在 Windows 系统上,运行:
venv\Scripts\activate
- 在 macOS 或 Linux 系统上,运行:
source venv/bin/activate
激活成功后,你会在命令行提示符的前面看到
(venv)
的字样。 - 在 Windows 系统上,运行:
3. 安装Python依赖包项目所需要的所有Python库都记录在 requirements.txt
文件中。在激活虚拟环境后,运行以下命令来自动安装所有必需的库:
pip install -r requirements.txt
这个过程可能需要一些时间,它会自动下载并安装如OpenCV、OpenAI等库。
4. 设置环境变量为了让程序能够使用OpenAI的GPT-4服务,你需要将你的API密钥配置好。
- 在项目的根目录(
AI-Youtube-Shorts-Generator
文件夹内)中,手动创建一个名为.env
的文件。 - 用文本编辑器打开这个新建的
.env
文件,在里面添加以下内容:OPENAI_API=your_openai_api_key_here
- 请将
your_openai_api_key_here
替换成你自己的真实OpenAI API密钥。保存并关闭文件。
如何使用
完成以上所有安装和配置步骤后,你就可以开始使用了。
- 确保你的命令行终端依然处于项目文件夹内,并且虚拟环境
(venv)
是激活状态。 - 确保你的
.env
文件已经正确配置了API密钥。 - 运行主程序:
python main.py
- 程序启动后,它会在命令行里提示你输入一个YouTube视频的URL。你只需找到一个你想处理的长视频,复制它的网址,然后粘贴到命令行里并按下回车。
- 之后,程序会自动开始执行所有任务,包括下载视频、转录音频、分析内容、提取和裁剪精华片段。这个过程会花费一些时间,具体取决于原视频的长度和你的网络速度。
- 处理完成后,生成的短视频文件会保存在项目的文件夹中。
应用场景
- 内容创作者对于在YouTube等平台发布视频的博主,这个工具可以极大地提高工作效率。他们可以将已经发布过的长视频(例如深度评测、教程、访谈或直播录像)重新利用,快速生成多个短视频,用于在YouTube Shorts、TikTok或Instagram Reels上吸引新观众,或为旧内容引流。
- 播客和演讲者可以将完整的播客录像或演讲视频输入此工具,AI会自动提取出其中最有见地、最有趣或最富争议性的观点,并将其制作成独立的短视频。这有助于将核心思想以更易于传播的形式分享出去。
- 数字营销人员营销团队可以利用这个工具,从产品介绍视频、用户评价视频或网络研讨会录像中,快速剪辑出具有吸引力的广告片段或宣传短片,用于社交媒体营销活动,以更低的成本覆盖更广泛的潜在客户。
- AI技术爱好者和开发者对于学习Python和AI技术的开发者来说,这是一个很好的实践项目。通过研究其源代码,可以具体了解如何综合运用GPT-4、Whisper、OpenCV等多种AI技术来解决一个真实世界的问题。
QA
- 这个工具是完全免费的吗?这个工具的源代码是开源且免费的,你可以自由下载和使用。但是,它依赖OpenAI的GPT-4和Whisper服务来分析视频内容,这些是付费服务。因此,在使用过程中,你的OpenAI账户会根据API的调用量产生费用。
- 我需要什么样的电脑配置才能运行它?这个工具主要消耗的是CPU和网络资源,对显卡没有特殊要求。视频处理(特别是FFmpeg转码)会比较消耗CPU性能。一个普通配置的现代计算机应该都可以运行,但更强的CPU会缩短视频处理的时间。
- 生成的短视频可以进行二次编辑吗?可以。工具最终生成的是标准的视频文件(如MP4格式)。你可以使用任何视频编辑软件,对这些AI生成的短视频进行进一步的修改,例如添加更复杂的字幕、特效或手动调整剪辑点。
- 这个工具支持中文视频吗?支持。工具使用的Whisper模型在识别多种语言(包括中文)方面表现非常出色,因此它可以很好地转录中文视频的语音内容。同时,GPT-4也能理解并处理中文文本,从而提取出中文视频的亮点。