Files
20260512-skg-tk/api/README.md
2026-05-14 10:25:50 +08:00

1.2 KiB
Raw Blame History

SKG TK 二创 API

FastAPI 后端,跑 yt-dlp + ffmpeg + ASR/翻译/文案改写 + MiniMax 配音管线。

启动

cd api
python3 -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt
cp .env.example .env  # 按需填 LLM_API_KEY / MINIMAX_API_KEY
uvicorn main:app --port 4291 --reload

路由

  • GET /health — 健康检查 + 配置状态
  • POST /jobs {url} — 创建 job后台跑下载/拆轨/抽帧
  • GET /jobs/{id} — 当前状态 + 产物
  • POST /jobs/{id}/transcribe — 触发 ASR + 翻译 + SKG 文案改写;配置 MiniMax 后生成配音
  • GET /jobs/{id}/video.mp4 — 原视频
  • GET /jobs/{id}/audio-script.mp3 — 改写文案的 MiniMax 配音
  • GET /jobs/{id}/frames/{i}.jpg — 第 i 张关键帧0-9

Mock 模式

未设 LLM_API_KEY 时,转录走本地 mock便于 UI 联调;未设 MINIMAX_API_KEY 时只生成改写文案,不生成配音文件。

依赖

  • ffmpeg 系统二进制(拆轨 / 抽帧)
  • yt-dlp 系统二进制(也可走 Python 包)
  • OpenAI 兼容 LLM 网关ASR / 翻译 / 文案改写)
  • MiniMax T2A HTTP改写文案配音使用 MINIMAX_API_KEY