MoneyPrinterTurbo — AI 一键生成高清短视频

MoneyPrinterTurbo 是今日 GitHub Trending 第一名项目,利用 AI 大模型一键生成高清短视频,全自动完成文案生成、素材匹配、字幕渲染、背景音乐合成,支持 OpenAI/DeepSeek/Gemini/Ollama 等多种模型接入。

项目概览

属性 信息
仓库 harry0703/MoneyPrinterTurbo
语言 Python(98.5%)
Stars 67,931(今日 +4,698)
许可证 开源(见 LICENSE)
架构 MVC(Web + API 双模式)

一句话描述:只需提供视频主题或关键词,即可全自动生成文案 → 素材 → 字幕 → 背景音乐 → 高清短视频。


核心功能

完整的视频生产管线

  1. 文案生成:支持 AI 自动生成或自定义文案,中文/英文均支持
  2. 素材匹配:高清无版权素材自动匹配,也支持本地素材上传
  3. 语音合成:多种语音可选,支持实时试听效果
  4. 字幕渲染:可调整字体、位置、颜色、大小及描边样式
  5. 背景音乐:随机选取或指定音乐文件,可调节音量
  6. 视频合成:竖屏 9:16 (1080×1920) / 横屏 16:9 (1920×1080)

多模型后端支持

兼容以下 LLM 提供商:

类型 服务商
国际 OpenAI、Azure、Google Gemini、Ollama、MiniMax
国内 DeepSeek、Moonshot(月之暗面)、通义千问、文心一言、ModelScope
其他 gpt4free、one-api、Pollinations

中国用户建议使用 DeepSeekMoonshot——国内直连无需 VPN,注册即送额度基本够用。

批量生成与定制化

  • 支持批量生成多个视频供筛选最优结果
  • 可设置单个视频片段时长以控制切换频率
  • 字幕引擎双模式:edge(快速轻量) / whisper(质量更可靠)

技术架构

1
2
3
4
5
6
7
8
9
MoneyPrinterTurbo
├── webui/          # Streamlit Web 界面(端口 8501)
├── main.py         # API 服务入口(端口 8080)
├── config.toml     # 核心配置文件
├── resource/
│   ├── songs/      # 背景音乐库
│   └── fonts/      # 字幕字体库
├── models/         # Whisper 本地模型(约 3GB)
└── docs/           # 文档与截图

技术栈

  • 前端 UI:Streamlit(Web 界面) + FastAPI(API 接口)
  • 视频处理:FFmpeg + ImageMagick
  • 字幕识别:Edge TTS / Faster Whisper
  • 包管理:推荐 uv(锁文件 uv.lock),兼容 pip/venv/Docker

部署方式

方式一:Windows 一键启动包(最简单)

下载解压后执行 update.bat 更新代码,再运行 start.bat 启动。

⚠️ 路径不要含中文/特殊字符/空格;启动后建议使用 Chrome 或 Edge 浏览器打开。

方式二:Docker 部署

1
2
3
4
git clone https://github.com/harry0703/MoneyPrinterTurbo.git
cd MoneyPrinterTurbo
docker-compose up
# 新版 Docker: docker compose up

访问地址:

  • WebUI: http://0.0.0.0:8501
  • API 文档: http://0.0.0.0:8080/docs

方式三:uv 本地部署(推荐 Mac/Linux)

1
2
3
4
5
6
7
8
9
git clone https://github.com/harry0703/MoneyPrinterTurbo.git
cd MoneyPrinterTurbo
uv python install 3.11
uv sync --frozen
# 安装 ImageMagick: brew install imagemagick (Mac) / sudo apt-get install imagemagick (Ubuntu)
# 启动 Web:
uv run streamlit run ./webui/Main.py --browser.gatherUsageStats=False
# 启动 API:
uv run python main.py

方式四:Google Colab 免环境配置

Open in Colab


配置要求

项目 最低 推荐 理想
CPU 4 核 6–8 核 8 核+
RAM 4 GB 8 GB 16 GB+
GPU 非必须 4 GB 显存+ 8 GB 显存+
  • 云端 LLM/TTS/在线素材场景:CPU 与内存优先
  • 本地 Whisper 转录/批量生成:GPU 加速显著

常见问题速查

问题 解决方案
No ffmpeg exe could be found gyan.dev 下载 ffmpeg,在 config.toml 中设置 ffmpeg_path
ImageMagick 安全策略阻止操作 修改 policy.xml 中 pattern="@" 的 rights 为 read|write
Too many open files ulimit -n 10240 提升系统文件句柄限制
Whisper 模型下载失败 从百度/夸克网盘手动下载 whisper-large-v3 放入 models/ 目录

项目亮点分析

  1. 全栈自动化:从主题输入到最终视频输出,整条管线零人工干预,真正实现"一键生成"
  2. 多模型灵活适配:同时覆盖国内外十余种 LLM 和 TTS 后端,降低使用门槛
  3. 双模式服务:WebUI 面向非技术用户,API 面向开发者集成,MVC 架构清晰可维护
  4. 实用主义设计:批量生成选优、片段时长可调、字幕双引擎等细节体现对真实使用场景的深度理解
  5. 生态友好部署:一键包/Docker/uv/pip/Colab 五种方式全覆盖,从体验者到开发者均有路径

相关链接


数据来源:GitHub Trending,抓取时间 2026-05-29 17:00 CST