auto-save 2026-05-14 10:20 (~7)

This commit is contained in:
2026-05-14 10:20:16 +08:00
parent ee32d83b6c
commit be1ae80750
7 changed files with 347 additions and 57 deletions

View File

@@ -1,6 +1,6 @@
# SKG TK 二创 API
FastAPI 后端,跑 yt-dlp + ffmpeg + Gemini ASR/翻译 管线。
FastAPI 后端,跑 yt-dlp + ffmpeg + ASR/翻译/文案改写 + MiniMax 配音管线。
## 启动
@@ -18,16 +18,18 @@ uvicorn main:app --port 4291 --reload
- `GET /health` — 健康检查 + 配置状态
- `POST /jobs` `{url}` — 创建 job后台跑下载/拆轨/抽帧
- `GET /jobs/{id}` — 当前状态 + 产物
- `POST /jobs/{id}/transcribe` — 触发 Gemini ASR + 翻译
- `POST /jobs/{id}/transcribe` — 触发 ASR + 翻译 + SKG 文案改写;配置 MiniMax 后生成配音
- `GET /jobs/{id}/video.mp4` — 原视频
- `GET /jobs/{id}/audio-script.mp3` — 改写文案的 MiniMax 配音
- `GET /jobs/{id}/frames/{i}.jpg` — 第 i 张关键帧0-9
## Mock 模式
未设 `GEMINI_API_KEY` 时,转录走本地 mock便于 UI 联调。
未设 `LLM_API_KEY` 时,转录走本地 mock便于 UI 联调;未设 `MINIMAX_API_KEY` 时只生成改写文案,不生成配音文件
## 依赖
- `ffmpeg` 系统二进制(拆轨 / 抽帧)
- `yt-dlp` 系统二进制(也可走 Python 包)
- `google-generativeai` PythonASR + 翻译
- OpenAI 兼容 LLM 网关ASR / 翻译 / 文案改写)
- MiniMax T2A HTTP改写文案配音使用 `MINIMAX_API_KEY`