auto-save 2026-05-18 15:29 (+1, ~5)

2026-05-18 15:29:47 +08:00
parent 408c5fca47
commit 1c451c6ab3
6 changed files with 616 additions and 6 deletions
--- a/.memory/status.md
+++ b/.memory/status.md
@@ -43,6 +43,7 @@

 ## 关键文件
 - `api/main.py` — FastAPI 后端、模型路由、任务状态、ASR/翻译/音频分析、生图、产品识别、首尾帧和视频接口。
+- `api/database.py` — 后端数据库层；当前用 SQLite 保存 document / job / media asset 元数据，媒体文件仍在 `jobs/<jobId>/`。
 - `api/.env.example` — 本地模型和网关模板；已包含 `GPT_TEXT_MODEL=gpt-4o`。
 - `deploy/.env.production.example` — 生产环境模板；视频默认 SKG Doubao / Seedance 网关。
 - `RULES.md` — 启动、部署事实、模型环境变量和项目规则。
@@ -54,6 +55,7 @@
 ## 主要 API
 ```
 GET  /health
+GET  /documents
 POST /jobs
 POST /jobs/upload
 GET  /jobs
@@ -89,10 +91,12 @@ POST /jobs/{id}/frames/{idx}/storyboard/video
 6. 当前主流程不直接批量提交视频；先走“分镜规划 → 首尾帧 → 人工审核”。
 7. 产品素材池默认是“同一产品”，不做不同产品身份判断；视角识别必须按佩戴者左 / 右、上 / 下、内 / 外侧描述。
 8. 自动抽帧默认是 `frames=6` + `target=random_subject` + `quality=accurate` + `mode=replace`；如果需要特定动作或表情，用“当前点抽帧”手动补。
-8. 后端长任务不要用 `--reload`。
-9. 关键帧 `index` 是稳定 ID，不等于数组下标；前端取帧用 `frames.find(x => x.index === idx)`。
+9. 文档是顶层业务归类：每个 TK 链接或上传视频默认一个 `document`，`job` 归属到 `document_id`；DB 存元数据和文件索引，视频 / 图片 / 音频文件不进 DB。
+10. 后端长任务不要用 `--reload`。
+11. 关键帧 `index` 是稳定 ID，不等于数组下标；前端取帧用 `frames.find(x => x.index === idx)`。

 ## 最近变更
+- 2026-05-18：新增后端数据库层，SQLite 默认落在 `APP_DB_URL` / `DATABASE_URL` 或 `JOBS_DIR/app.db`；`/documents` 返回文档归类列表，`/health.database` 返回 DB 状态。
 - 2026-05-18：`VISION_MODEL`、`REWRITE_MODEL`、`AUDIO_REWRITE_MODEL` 切到 GPT 默认模型 `gpt-4o`，并加旧 Gemini 环境变量归一化保护。
 - 2026-05-18：语音通道固定 Azure OpenAI TTS，移除 MiniMax fallback，并按 `AZURE_TTS_PATHS` 尝试语音路径。
 - 2026-05-18：当前主路径暂停直接提交视频，改为逐条首尾帧闸门。