feat: use OpenAI Sora for long videos

This commit is contained in:
2026-05-30 17:04:45 +08:00
parent a10cf6e7fb
commit 9c41cafb1a
11 changed files with 327 additions and 47 deletions

View File

@@ -10,6 +10,7 @@
- 平台:个人 VPS `76.13.31.179`Docker Compose接入现有 Coolify Traefik
- 发布状态VPS 生产已发布,仅个人使用
- 最近生产部署2026-05-22视频面板修复 60 秒成片任务 ID 映射;`video_turntable_60s` 等已完成视频会替代对应默认模板卡片,不再重复显示不可播放的空视频项;对应代码提交 `7abbb7d`
- 待部署变更:视频 provider 已改为默认 OpenAI Sora`VIDEO_PROVIDER=openai_sora`Seedance 仅作为可选回退;视频模板目标时长统一不少于 60 秒,并通过 OpenAI extend 链路补足长视频
- 服务名 / 容器名:`ai-toy-patent-workflow`
- 服务器路径:`/opt/ai-toy-patent-workflow`
- 主站 / 前端https://ai-toy.kang-kang.com
@@ -38,11 +39,15 @@
- 风格示意图:运行 `npm run styles:previews -- --force` 用 GPT 图片模型生成 `public/style-previews/*.png`UI 左侧风格卡片直接引用这些小图
## 环境变量
- `OPENAI_API_KEY` — GPT API Key文本/结构化/图片生成统一走 GPT 最高规格配置
- `OPENAI_API_KEY` — GPT / OpenAI API Key文本结构化图片生成以及默认 OpenAI Sora 视频生成共用
- `GPT_TEXT_MODEL` — 默认 `gpt-5.5`,用于角色设定等结构化输出
- `GPT_IMAGE_MODEL` — 默认 `gpt-image-2`,用于意向图和三类素材包图片生成
- `GPT_API_BASE` — 默认 `https://api.openai.com/v1`
- `SEEDANCE_API_KEY` — Seedance 视频生成 Key未配置时视频接口返回 503
- `VIDEO_PROVIDER` — 默认 `openai_sora`;需要回退时可设为 `seedance`
- `OPENAI_VIDEO_MODEL` — 默认 `sora-2-pro`,用于 OpenAI 视频生成
- `OPENAI_VIDEO_MIN_SECONDS` — 默认 `60`;视频模板目标时长不得低于 60 秒
- `OPENAI_VIDEO_QUALITY` — 默认生产建议 `high`,对应 OpenAI 允许的视频输出尺寸
- `SEEDANCE_API_KEY` — Seedance 视频生成 Key`VIDEO_PROVIDER=seedance` 时使用,未配置则视频接口返回 503
- `SEEDANCE_MODEL` — 默认 `doubao-seedance-2-0-260128`
- `SEEDANCE_API_BASE` — 默认 `https://ark.cn-beijing.volces.com/api/v3`
- `PUBLIC_APP_URL` — 生产填公网入口,用于把 `/api/img/...` 补成 Seedance 可访问的绝对 URL
@@ -57,7 +62,7 @@
## 规则
- 全项目规则真源:`/Users/kangwan/Projects/code/20260317-rules-dashboard/RULES.md`
- 文本/结构化/图片生成统一使用 GPT 最高规格配置
- 视频生成固定使用 Seedance
- 视频生成默认使用 OpenAI SoraSeedance 只作为可选回退 provider
- 不允许编造不存在的部署域名、账号、密码
## 图像链路事实
@@ -95,10 +100,10 @@
5. 锁定角色设定 `CharacterSpec`
6. 串行生成图片包:必须从专利包开始,顺序为 `专利包 -> 配件包 -> 生产打样包 -> 宣发包`
7. 前一个图片包完整生成后,下一个图片包才解锁;不提供“一键全包”入口或全包 API
8. 四个图片包完成后,才解锁文案模板和 Seedance 视频任务:旋转展示、开箱、触感细节、角色故事
8. 四个图片包完成后,才解锁文案模板和 OpenAI Sora 视频任务:旋转展示、开箱、触感细节、角色故事、工厂预览;每条视频目标时长不少于 60 秒
9. 侧栏保留历史会话,点击切换
## 后续路线
- 导出专利包PNG高清 + PDF合订
- ZIP/PDF 打包下载
- Seedance 任务轮询 UI
- OpenAI Sora 长视频任务轮询 UI 细化