feat: use OpenAI Sora for long videos

2026-05-30 17:04:45 +08:00
parent a10cf6e7fb
commit 9c41cafb1a
11 changed files with 327 additions and 47 deletions
--- a/RULES.md
+++ b/RULES.md
@@ -10,6 +10,7 @@
 - 平台：个人 VPS `76.13.31.179`，Docker Compose，接入现有 Coolify Traefik
 - 发布状态：VPS 生产已发布，仅个人使用
 - 最近生产部署：2026-05-22，视频面板修复 60 秒成片任务 ID 映射；`video_turntable_60s` 等已完成视频会替代对应默认模板卡片，不再重复显示不可播放的空视频项；对应代码提交 `7abbb7d`
+- 待部署变更：视频 provider 已改为默认 OpenAI Sora（`VIDEO_PROVIDER=openai_sora`），Seedance 仅作为可选回退；视频模板目标时长统一不少于 60 秒，并通过 OpenAI extend 链路补足长视频
 - 服务名 / 容器名：`ai-toy-patent-workflow`
 - 服务器路径：`/opt/ai-toy-patent-workflow`
 - 主站 / 前端：https://ai-toy.kang-kang.com
@@ -38,11 +39,15 @@
 - 风格示意图：运行 `npm run styles:previews -- --force` 用 GPT 图片模型生成 `public/style-previews/*.png`；UI 左侧风格卡片直接引用这些小图

 ## 环境变量
- `OPENAI_API_KEY` — GPT API Key；文本/结构化/图片生成统一走 GPT 最高规格配置
+- `OPENAI_API_KEY` — GPT / OpenAI API Key；文本、结构化、图片生成以及默认 OpenAI Sora 视频生成共用
 - `GPT_TEXT_MODEL` — 默认 `gpt-5.5`，用于角色设定等结构化输出
 - `GPT_IMAGE_MODEL` — 默认 `gpt-image-2`，用于意向图和三类素材包图片生成
 - `GPT_API_BASE` — 默认 `https://api.openai.com/v1`
- `SEEDANCE_API_KEY` — Seedance 视频生成 Key；未配置时视频接口返回 503
+- `VIDEO_PROVIDER` — 默认 `openai_sora`；需要回退时可设为 `seedance`
+- `OPENAI_VIDEO_MODEL` — 默认 `sora-2-pro`，用于 OpenAI 视频生成
+- `OPENAI_VIDEO_MIN_SECONDS` — 默认 `60`；视频模板目标时长不得低于 60 秒
+- `OPENAI_VIDEO_QUALITY` — 默认生产建议 `high`，对应 OpenAI 允许的视频输出尺寸
+- `SEEDANCE_API_KEY` — Seedance 视频生成 Key；仅 `VIDEO_PROVIDER=seedance` 时使用，未配置则视频接口返回 503
 - `SEEDANCE_MODEL` — 默认 `doubao-seedance-2-0-260128`
 - `SEEDANCE_API_BASE` — 默认 `https://ark.cn-beijing.volces.com/api/v3`
 - `PUBLIC_APP_URL` — 生产填公网入口，用于把 `/api/img/...` 补成 Seedance 可访问的绝对 URL
@@ -57,7 +62,7 @@
 ## 规则
 - 全项目规则真源：`/Users/kangwan/Projects/code/20260317-rules-dashboard/RULES.md`
 - 文本/结构化/图片生成统一使用 GPT 最高规格配置
- 视频生成固定使用 Seedance
+- 视频生成默认使用 OpenAI Sora；Seedance 只作为可选回退 provider
 - 不允许编造不存在的部署域名、账号、密码

 ## 图像链路事实
@@ -95,10 +100,10 @@
 5. 锁定角色设定 `CharacterSpec`
 6. 串行生成图片包：必须从专利包开始，顺序为 `专利包 -> 配件包 -> 生产打样包 -> 宣发包`
 7. 前一个图片包完整生成后，下一个图片包才解锁；不提供“一键全包”入口或全包 API
-8. 四个图片包完成后，才解锁文案模板和 Seedance 视频任务：旋转展示、开箱、触感细节、角色故事
+8. 四个图片包完成后，才解锁文案模板和 OpenAI Sora 视频任务：旋转展示、开箱、触感细节、角色故事、工厂预览；每条视频目标时长不少于 60 秒
 9. 侧栏保留历史会话，点击切换

 ## 后续路线
 - 导出专利包：PNG高清 + PDF合订
 - ZIP/PDF 打包下载
- Seedance 任务轮询 UI
+- OpenAI Sora 长视频任务轮询 UI 细化