From 779e9b342b2d64f2b95939b5ce6ddbecd9c3b02b Mon Sep 17 00:00:00 2001
From: kang <wankang2050@gmail.com>
Date: Mon, 25 May 2026 15:55:43 +0800
Subject: [PATCH] feat: queue video generation per user

---
 RULES.md                       |   1 +
 api/.env.example               |   2 +
 api/main.py                    | 191 +++++++++++++++++++++++++++++++--
 deploy/.env.production.example |   2 +
 docs/source-analysis.html      |  23 +++-
 web/app/page.tsx               |  51 ++++++---
 web/lib/api.ts                 |   3 +
 7 files changed, 243 insertions(+), 30 deletions(-)

diff --git a/RULES.md b/RULES.md
index 6be0507..0e1b424 100644
--- a/RULES.md
+++ b/RULES.md
@@ -134,6 +134,7 @@
 - `FEISHU_OAUTH_SCOPE`：飞书 OAuth 授权范围；默认空值，按飞书应用后台已开权限执行。
 - `FEISHU_ALLOWED_EMAIL_DOMAINS` / `FEISHU_ALLOWED_EMAILS` / `FEISHU_ALLOWED_TENANT_KEYS`：可选飞书账号白名单；留空时由飞书应用可见范围控制。
 - `AUTH_DATA_ISOLATION_ENABLED`：多用户数据隔离开关，生产保持 `true`；新建 `Job` / `AgentRun` 会写入当前登录用户 owner，列表和详情访问只返回本人数据。
+- `VIDEO_QUEUE_MAX_CONCURRENT` / `VIDEO_QUEUE_MAX_CONCURRENT_PER_USER`：视频生成进程内队列并发上限，生产默认全局同时 2 个、单用户同时 1 个；同一用户连续提交会排队，其他用户仍可获得执行机会。当前队列不依赖 Redis，API 容器重启会把未完成视频标记为失败并提示重新生成。
 - `FFMPEG_BIN` / `FFPROBE_BIN`：可选本地媒体二进制路径；本机 Homebrew ffmpeg 动态库损坏时，后端会自动跳过不可用的 PATH 版本并尝试本机静态 ffmpeg 备选，生产仍建议使用系统 ffmpeg/ffprobe
 - 生产环境变量：服务器只使用 `deploy/.env.production`，模板为 `deploy/.env.production.example`；真实 Key 不入库
 - 同步生产代码时必须排除服务器真实 `deploy/.env.production`，只同步 `deploy/.env.production.example`；网页登录密码、session secret、ASR/API Key 只保留在服务器环境文件和 `/root/skg-marketing-studio-login.txt`
diff --git a/api/.env.example b/api/.env.example
index 96baa14..b56fe99 100644
--- a/api/.env.example
+++ b/api/.env.example
@@ -9,6 +9,8 @@ WEB_AUTH_SESSION_SECRET=
 WEB_AUTH_COOKIE_NAME=skg_marketing_session
 WEB_AUTH_COOKIE_SECURE=false
 AUTH_DATA_ISOLATION_ENABLED=true
+VIDEO_QUEUE_MAX_CONCURRENT=2
+VIDEO_QUEUE_MAX_CONCURRENT_PER_USER=1
 
 # 飞书免登录（OAuth）。生产回调地址需同步配置到飞书开放平台应用安全设置。
 FEISHU_APP_ID=
diff --git a/api/main.py b/api/main.py
index b15dcfe..a9e143d 100644
--- a/api/main.py
+++ b/api/main.py
@@ -16,6 +16,7 @@ import threading
 import time
 import uuid
 from contextlib import asynccontextmanager
+from dataclasses import dataclass
 from pathlib import Path
 from typing import Literal
 from urllib.parse import urlencode
@@ -269,6 +270,8 @@ FEISHU_ALLOWED_EMAIL_DOMAINS = os.getenv("FEISHU_ALLOWED_EMAIL_DOMAINS", "").str
 FEISHU_ALLOWED_EMAILS = os.getenv("FEISHU_ALLOWED_EMAILS", "").strip()
 FEISHU_ALLOWED_TENANT_KEYS = os.getenv("FEISHU_ALLOWED_TENANT_KEYS", "").strip()
 AUTH_DATA_ISOLATION_ENABLED = os.getenv("AUTH_DATA_ISOLATION_ENABLED", "true").strip().lower() not in {"0", "false", "no", "off"}
+VIDEO_QUEUE_MAX_CONCURRENT = max(1, int(os.getenv("VIDEO_QUEUE_MAX_CONCURRENT", "2").strip() or "2"))
+VIDEO_QUEUE_MAX_CONCURRENT_PER_USER = max(1, int(os.getenv("VIDEO_QUEUE_MAX_CONCURRENT_PER_USER", "1").strip() or "1"))
 PASSWORD_AUTH_CONFIGURED = bool(WEB_AUTH_USERNAME and WEB_AUTH_PASSWORD and WEB_AUTH_SESSION_SECRET)
 FEISHU_AUTH_CONFIGURED = bool(FEISHU_APP_ID and FEISHU_APP_SECRET and WEB_AUTH_SESSION_SECRET)
 WEB_AUTH_CONFIGURED = bool(PASSWORD_AUTH_CONFIGURED or FEISHU_AUTH_CONFIGURED)
@@ -466,6 +469,9 @@ class GeneratedVideo(BaseModel):
     progress: int = 0
     error: str = ""
     created_at: float = 0.0
+    queue_position: int = 0
+    queue_size: int = 0
+    queue_message: str = ""
 
 
 class VideoSourceRef(BaseModel):
@@ -907,6 +913,20 @@ AUDIO_WORKERS_RUNNING: set[str] = set()
 AUDIO_WORKERS_LOCK = threading.Lock()
 
 
+@dataclass
+class VideoQueueTask:
+    job_id: str
+    video_id: str
+    owner_id: str
+    args: tuple
+    created_at: float
+
+
+VIDEO_QUEUE: list[VideoQueueTask] = []
+VIDEO_QUEUE_RUNNING: dict[str, VideoQueueTask] = {}
+VIDEO_QUEUE_LOCK = threading.Lock()
+
+
 def ensure_auth_configured() -> None:
     if not WEB_AUTH_CONFIGURED:
         raise HTTPException(503, "WEB_AUTH_SESSION_SECRET 以及账号密码或飞书 OAuth 未配置")
@@ -1777,6 +1797,124 @@ def update_generated_video(job_id: str, video_id: str, **kw) -> None:
     update(job, generated_videos=updated)
 
 
+def generated_video_exists(job_id: str, video_id: str) -> bool:
+    job = JOBS.get(job_id)
+    return bool(job and any(v.id == video_id for v in job.generated_videos))
+
+
+def _video_queue_owner(job: Job) -> str:
+    return (job.owner_id or f"job:{job.id}").strip()
+
+
+def _video_queue_owner_running_locked(owner_id: str) -> bool:
+    return any(task.owner_id == owner_id for task in VIDEO_QUEUE_RUNNING.values())
+
+
+def _refresh_video_queue_positions_locked() -> None:
+    queue_size = len(VIDEO_QUEUE)
+    for position, task in enumerate(VIDEO_QUEUE, start=1):
+        if not generated_video_exists(task.job_id, task.video_id):
+            continue
+        if _video_queue_owner_running_locked(task.owner_id):
+            message = "排队中 · 你的上一个视频生成中"
+        elif position == 1:
+            message = "排队中 · 即将开始"
+        else:
+            message = f"排队中 · 前方 {position - 1} 个任务"
+        update_generated_video(
+            task.job_id,
+            task.video_id,
+            status="queued",
+            progress=0,
+            queue_position=position,
+            queue_size=queue_size,
+            queue_message=message,
+        )
+
+
+def _video_queue_running_by_owner_locked() -> dict[str, int]:
+    counts: dict[str, int] = {}
+    for task in VIDEO_QUEUE_RUNNING.values():
+        counts[task.owner_id] = counts.get(task.owner_id, 0) + 1
+    return counts
+
+
+def dispatch_video_queue() -> None:
+    tasks_to_start: list[VideoQueueTask] = []
+    with VIDEO_QUEUE_LOCK:
+        running_by_owner = _video_queue_running_by_owner_locked()
+        while len(VIDEO_QUEUE_RUNNING) < VIDEO_QUEUE_MAX_CONCURRENT:
+            selected_index = -1
+            for index, task in enumerate(VIDEO_QUEUE):
+                if not generated_video_exists(task.job_id, task.video_id):
+                    selected_index = index
+                    break
+                if running_by_owner.get(task.owner_id, 0) < VIDEO_QUEUE_MAX_CONCURRENT_PER_USER:
+                    selected_index = index
+                    break
+            if selected_index < 0:
+                break
+
+            task = VIDEO_QUEUE.pop(selected_index)
+            if not generated_video_exists(task.job_id, task.video_id):
+                continue
+
+            VIDEO_QUEUE_RUNNING[task.video_id] = task
+            running_by_owner[task.owner_id] = running_by_owner.get(task.owner_id, 0) + 1
+            update_generated_video(
+                task.job_id,
+                task.video_id,
+                status="in_progress",
+                progress=1,
+                queue_position=0,
+                queue_size=len(VIDEO_QUEUE),
+                queue_message="准备素材…",
+            )
+            tasks_to_start.append(task)
+        _refresh_video_queue_positions_locked()
+
+    for task in tasks_to_start:
+        threading.Thread(target=_run_video_queue_task, args=(task,), daemon=True).start()
+
+
+def _run_video_queue_task(task: VideoQueueTask) -> None:
+    try:
+        if generated_video_exists(task.job_id, task.video_id):
+            render_storyboard_video(*task.args)
+    finally:
+        with VIDEO_QUEUE_LOCK:
+            VIDEO_QUEUE_RUNNING.pop(task.video_id, None)
+            _refresh_video_queue_positions_locked()
+        dispatch_video_queue()
+
+
+def enqueue_video_task(job: Job, video_id: str, task_args: tuple) -> None:
+    task = VideoQueueTask(
+        job_id=job.id,
+        video_id=video_id,
+        owner_id=_video_queue_owner(job),
+        args=task_args,
+        created_at=time.time(),
+    )
+    with VIDEO_QUEUE_LOCK:
+        VIDEO_QUEUE.append(task)
+        _refresh_video_queue_positions_locked()
+    dispatch_video_queue()
+
+
+def cancel_queued_video_task(job_id: str, video_id: str) -> bool:
+    removed = False
+    with VIDEO_QUEUE_LOCK:
+        before = len(VIDEO_QUEUE)
+        VIDEO_QUEUE[:] = [task for task in VIDEO_QUEUE if not (task.job_id == job_id and task.video_id == video_id)]
+        removed = len(VIDEO_QUEUE) != before
+        if removed:
+            _refresh_video_queue_positions_locked()
+    if removed:
+        dispatch_video_queue()
+    return removed
+
+
 @asynccontextmanager
 async def lifespan(_: FastAPI):
     try:
@@ -1838,6 +1976,23 @@ async def lifespan(_: FastAPI):
                     recovered_frames.append(f)
                 if subject_generation_interrupted:
                     update(job, frames=recovered_frames, message="服务重启 · 上次主体生成已中断，可重新生成")
+                video_generation_interrupted = False
+                recovered_videos = []
+                for video in job.generated_videos:
+                    if video.status in {"queued", "in_progress"}:
+                        recovered_videos.append(video.model_copy(update={
+                            "status": "failed",
+                            "progress": 100,
+                            "error": "服务重启 · 上次视频生成已中断，请重新生成",
+                            "queue_position": 0,
+                            "queue_size": 0,
+                            "queue_message": "",
+                        }))
+                        video_generation_interrupted = True
+                    else:
+                        recovered_videos.append(video)
+                if video_generation_interrupted:
+                    update(job, generated_videos=recovered_videos, message="服务重启 · 上次视频生成已中断，请重新生成")
                 JOBS[p.name] = job
             except Exception:
                 pass
@@ -7850,7 +8005,7 @@ def render_storyboard_video(
                 product_img = out_dir / f"product_reference_{i}.jpg"
                 prepare_video_reference(product_ref_path, product_img)
                 prepared_product_imgs.append(product_img)
-        update_generated_video(job_id, local_id, status="in_progress", progress=5)
+        update_generated_video(job_id, local_id, status="in_progress", progress=5, queue_message="准备素材…")
         with httpx.Client(timeout=120) as client:
             payload = {"model": model, "prompt": prompt, "size": size}
             payload[VIDEO_DURATION_FIELD] = seconds
@@ -7880,7 +8035,14 @@ def render_storyboard_video(
             status = normalize_video_status(data.get("status"))
             progress = video_progress(data, 5)
             direct_url = video_url_from_response(data)
-            update_generated_video(job_id, local_id, provider_id=video_api_id, status=status, progress=progress)
+            update_generated_video(
+                job_id,
+                local_id,
+                provider_id=video_api_id,
+                status=status,
+                progress=progress,
+                queue_message="生成中…" if status in {"queued", "in_progress"} else "",
+            )
 
             deadline = time.time() + VIDEO_POLL_TIMEOUT_SECONDS
             while status in {"queued", "in_progress"} and time.time() < deadline:
@@ -7891,10 +8053,16 @@ def render_storyboard_video(
                 status = normalize_video_status(pdata.get("status"))
                 progress = video_progress(pdata, progress)
                 direct_url = video_url_from_response(pdata) or direct_url
-                update_generated_video(job_id, local_id, status=status, progress=progress)
+                update_generated_video(
+                    job_id,
+                    local_id,
+                    status=status,
+                    progress=progress,
+                    queue_message="生成中…" if status in {"queued", "in_progress"} else "",
+                )
 
             if status != "completed":
-                update_generated_video(job_id, local_id, status="failed", error=f"video status: {status}", progress=progress)
+                update_generated_video(job_id, local_id, status="failed", error=f"video status: {status}", progress=progress, queue_message="")
                 return
 
             download_generated_video(client, base, headers, video_api_id, direct_url, out_mp4)
@@ -7905,9 +8073,12 @@ def render_storyboard_video(
                 progress=100,
                 url=f"/jobs/{job_id}/storyboard-videos/{local_id}.mp4",
                 error="",
+                queue_position=0,
+                queue_size=0,
+                queue_message="",
             )
     except Exception as e:
-        update_generated_video(job_id, local_id, status="failed", error=str(e)[:500])
+        update_generated_video(job_id, local_id, status="failed", error=str(e)[:500], queue_message="")
 
 
 @app.post("/jobs/{job_id}/frames/{idx}/storyboard/quick-plan", response_model=StoryboardScene)
@@ -8015,6 +8186,7 @@ def _enqueue_storyboard_videos(job: Job, frame: KeyFrame, req: GenerateStoryboar
         source_ref = None
     items: list[GeneratedVideo] = []
     ids: list[str] = []
+    queued_tasks: list[tuple[str, tuple]] = []
     for i in range(count):
         local_id = uuid.uuid4().hex[:12]
         ids.append(local_id)
@@ -8033,13 +8205,13 @@ def _enqueue_storyboard_videos(job: Job, frame: KeyFrame, req: GenerateStoryboar
             duration=float(seconds),
             progress=0,
             created_at=time.time(),
+            queue_message="排队中…",
         ))
         task_args = (job.id, local_id, "", ref_path, variant_prompt, model, seconds, video_size, source_ref, last_ref_path, reference_ref_paths, primary_role)
-        if bg is not None:
-            bg.add_task(render_storyboard_video, *task_args)
-        else:
-            threading.Thread(target=render_storyboard_video, args=task_args, daemon=True).start()
+        queued_tasks.append((local_id, task_args))
     update(job, generated_videos=items + job.generated_videos, message=f"视频候选已提交 · 分镜 {frame.index + 1} · {count} 条")
+    for local_id, task_args in queued_tasks:
+        enqueue_video_task(job, local_id, task_args)
     return ids
 
 
@@ -9482,6 +9654,7 @@ def delete_storyboard_video(job_id: str, video_id: str) -> Job:
     kept = [v for v in job.generated_videos if v.id != video_id]
     if len(kept) == before:
         raise HTTPException(404, "generated video not found")
+    cancel_queued_video_task(job_id, video_id)
     out_dir = job_dir(job_id) / "storyboard_videos" / video_id
     if out_dir.exists():
         try:
diff --git a/deploy/.env.production.example b/deploy/.env.production.example
index cf44f29..2ec829c 100644
--- a/deploy/.env.production.example
+++ b/deploy/.env.production.example
@@ -16,6 +16,8 @@ WEB_AUTH_SESSION_SECRET=
 WEB_AUTH_COOKIE_NAME=skg_marketing_session
 WEB_AUTH_COOKIE_SECURE=true
 AUTH_DATA_ISOLATION_ENABLED=true
+VIDEO_QUEUE_MAX_CONCURRENT=2
+VIDEO_QUEUE_MAX_CONCURRENT_PER_USER=1
 
 # Feishu OAuth login. Register this callback in the Feishu developer console:
 # https://marketing.skg.com/api/auth/feishu/callback
diff --git a/docs/source-analysis.html b/docs/source-analysis.html
index e8bba28..1073201 100644
--- a/docs/source-analysis.html
+++ b/docs/source-analysis.html
@@ -581,8 +581,8 @@
           <div class="step"><div class="num">03</div><h3>选择模型和规格</h3><p><code>GET /health</code> 返回 <code>image_options</code>、<code>image_size_options</code>、<code>video_options</code>、<code>video_size_options</code> 和 <code>video_duration_options</code>；首页按当前生成方式切换模型、图片尺寸、视频画幅和视频时长。</p></div>
           <div class="step"><div class="num">04</div><h3>上传帧 / 空白任务</h3><p><code>POST /creative/jobs/image</code> 创建 0 号关键帧；首尾帧模式再用 <code>/frames/upload</code> 上传尾帧。</p></div>
           <div class="step"><div class="num">05</div><h3>手写提示词</h3><p>首页不再生成营销文案或自动展开产品 / 人群配置，用户直接写图片或视频提示词。</p></div>
-          <div class="step"><div class="num">06</div><h3>生成图片 / 视频</h3><p><code>generateImage</code> 传 <code>mode=text</code>、图片模型和图片尺寸；<code>generateStoryboardVideo</code> 提交文本、模型、画幅、时长、可选 <code>first_image</code> 和可选 <code>last_image</code>。</p></div>
-          <div class="step"><div class="num">07</div><h3>结果沉淀</h3><p>首页只在对话框下方显示最新图片或视频；所有图片/视频缩略图继续复用 <code>MediaAssetTile</code>。</p></div>
+          <div class="step"><div class="num">06</div><h3>生成图片 / 视频</h3><p><code>generateImage</code> 传 <code>mode=text</code>、图片模型和图片尺寸；<code>generateStoryboardVideo</code> 提交文本、模型、画幅、时长、可选 <code>first_image</code> 和可选 <code>last_image</code>。视频提交后先写入 <code>queued</code> 占位，再由后端队列按并发上限启动。</p></div>
+          <div class="step"><div class="num">07</div><h3>结果沉淀</h3><p>首页只在对话框下方显示最新图片或视频；视频会显示排队位置、生成进度、完成播放或失败可重试状态；所有图片/视频缩略图继续复用 <code>MediaAssetTile</code>。</p></div>
           <div class="step"><div class="num">08</div><h3>详情页</h3><p><code>/detail/?job=&lt;id&gt;</code> 展示参考图、全量生成图、视频候选、提示词和营销图文，并支持继续生成。</p></div>
           <div class="step"><div class="num">09</div><h3>高级复刻</h3><p>旧 <code>AdRecreationBoard</code> 与 <code>/agent/</code> 作为高级入口保留，不再是默认路径。</p></div>
         </div>
@@ -597,7 +597,7 @@
               <tbody>
                 <tr><td><code>web/next.config.mjs</code></td><td>Next.js 构建配置：静态导出、图片不走优化、禁用开发环境左下角 Next Dev Indicator，并移除 Next 16 已不支持的 <code>eslint</code> 顶层配置，避免本地 dev 出现配置 Issue 提示。</td></tr>
                 <tr><td><code>web/app/globals.css</code></td><td>全局主题变量、登录页视觉样式、信息流工作台玻璃拟态 token、ReactFlow 样式引用，以及本地开发态 <code>nextjs-portal</code> 遮挡隐藏规则。工作台在 <code>skg-board-theme</code> 内按 Figma 本地 MCP 参考改成黑灰玻璃系统：深灰背景、<code>#383838</code> 胶囊侧栏、<code>rgba(255,255,255,.1)</code> 玻璃面、<code>backdrop-filter: blur(5px)</code>、<code>20px</code> 圆角、<code>10px 10px 10px rgba(0,0,0,.3)</code> 阴影和绿黄状态色；新增 <code>skg-board-shell</code>、<code>skg-board-rail</code>、<code>skg-glass-card</code>、<code>skg-glass-card--flat</code>、<code>skg-status-orb</code> 等样式。侧栏改为跟随视口拉满工作台可用高度的悬停胶囊，桌面最小 600px，展开时在同一侧栏内承载素材输入抽屉。明暗主题已分开维护 shell、panel、glass、stat、action 和音频波形 token；暗色压低灰雾和面板底色，明亮模式改为暖白工作台，避免指标卡、按钮和波形继续残留黑底/白线；顶部指标卡增加紫、黄绿、琥珀、青绿、绿色光斑变量，接近原版多色玻璃卡效果。主/次按钮、指标卡和空状态继续走统一类，避免各板块散写不同玻璃效果。</td></tr>
-                <tr><td><code>web/app/page.tsx</code></td><td>当前默认首页：单对话框生成台。页面只保留顶部极轻量品牌和中央对话框，四个主按钮是文生视频、文生图、首帧生视频、首尾帧生视频；首帧 / 首尾帧模式才显示上传位，用户必须手写提示词后点击生成。页面启动时读取 <code>getRuntimeHealth</code>，按 <code>image_options</code> / <code>video_options</code> 显示模型下拉，按 <code>image_size_options</code> 显示文生图尺寸，按 <code>video_size_options</code> 和 <code>video_duration_options</code> 显示视频画幅和真实可用时长；当前 Doubao / Seedance 生产链路最多暴露 15 秒，不再把 30 秒作为单条可选项。每次生成都会创建新的轻量 <code>Job</code>，文生图调用 <code>generateImage</code> 并传图片模型和尺寸，视频调用 <code>generateStoryboardVideo</code> 并传视频模型、画幅和时长；首尾帧模式先用 <code>createCreativeImageJob</code> 保存首帧，再用 <code>uploadReferenceFrame</code> 保存尾帧并以 <code>last_image</code> 提交。首页视频提交后每 2.6 秒轮询 <code>getJob</code>，完成后结果卡直接显示可播放 controls，避免完成视频只是静态首帧看起来“没有效果”。图片/视频缩略图统一复用 <code>MediaAssetTile</code>，支持顶层 hover 预览和删除；旧 TK 复刻工作台组件仍保留在 <code>web/components/ad-recreation-board.tsx</code>，但不再作为默认首页渲染。</td></tr>
+                <tr><td><code>web/app/page.tsx</code></td><td>当前默认首页：单对话框生成台。页面只保留顶部极轻量品牌和中央对话框，四个主按钮是文生视频、文生图、首帧生视频、首尾帧生视频；首帧 / 首尾帧模式才显示上传位，用户必须手写提示词后点击生成。页面启动时读取 <code>getRuntimeHealth</code>，按 <code>image_options</code> / <code>video_options</code> 显示模型下拉，按 <code>image_size_options</code> 显示文生图尺寸，按 <code>video_size_options</code> 和 <code>video_duration_options</code> 显示视频画幅和真实可用时长；当前 Doubao / Seedance 生产链路最多暴露 15 秒，不再把 30 秒作为单条可选项。每次生成都会创建新的轻量 <code>Job</code>，文生图调用 <code>generateImage</code> 并传图片模型和尺寸，视频调用 <code>generateStoryboardVideo</code> 并传视频模型、画幅和时长；首尾帧模式先用 <code>createCreativeImageJob</code> 保存首帧，再用 <code>uploadReferenceFrame</code> 保存尾帧并以 <code>last_image</code> 提交。首页视频提交后每 2.6 秒轮询 <code>getJob</code>，结果卡会把 <code>queued</code> 显示为“排队中 / 前方 N 个任务 / 你的上一个视频生成中”，把 <code>in_progress</code> 显示为生成进度，完成后直接显示可播放 controls，避免完成视频只是静态首帧看起来“没有效果”。图片/视频缩略图统一复用 <code>MediaAssetTile</code>，支持顶层 hover 预览和删除；旧 TK 复刻工作台组件仍保留在 <code>web/components/ad-recreation-board.tsx</code>，但不再作为默认首页渲染。</td></tr>
                 <tr><td><code>web/app/detail/page.tsx</code></td><td>任务详情页：静态导出路由 <code>/detail/?job=&lt;id&gt;</code>，通过 query 读取 job id，调用 <code>getJob</code> 恢复同一任务。页面展示参考图、全部生成图、视频候选、营销图文方案和历史提示词，可继续调用 <code>generateImage</code>、<code>generateStoryboardVideo</code>、<code>generateCreativeCopy</code>，并支持删除图片/视频。该页继续依赖后端 owner 过滤，用户不能通过切换 URL 读取别人的任务。</td></tr>
                 <tr><td><code>web/app/agent/page.tsx</code></td><td>新增一键出片终端页：只保留 TikTok 链接、产品图上传、实时 <code>Agent Terminal</code> 和最终成片播放器；通过 <code>POST /agent-runs</code> 创建受限后台状态机任务，通过 <code>GET /agent-runs/{id}</code> 轮询日志、进度、审片图和最终 mp4。该页不替代旧工作台深度编辑能力，只承接“用户只看成品”的快速出片主路径。</td></tr>
                 <tr><td><code>web/components/ad-recreation-board.tsx</code></td><td>信息流广告复刻工作表：外壳按 Figma “Dashboard Glassmorphism”参考整体改为黑灰玻璃工作台，<code>WorkbenchRail</code> 默认收起为拉满工作台可用高度的 65px 胶囊工具条，只保留真实动作入口：素材任务、资源库和主题切换；鼠标移入或键盘聚焦侧栏时，<code>skg-board-rail</code> 切换 <code>is-open</code> 并从左侧展开 320px 素材输入抽屉，点击素材任务按钮可固定展开。顶部从登录页式 brand strip 改为轻量生产控制条，左侧显示 <code>未来健康 · 营销内容工作台</code>、主标题 <code>营销内容工作台</code> 和副标题 <code>信息流广告复刻生产</code>，右侧保留素材/当前/视频/文案段/背景音指标，并用紫、黄绿、琥珀、青绿、绿色光斑卡片增强原版玻璃拟态的颜色层次。主内容只保留源视频拆解工作区，素材输入的数据流、接口、模型调用和状态推导不变。工作台外层已取消 <code>1800x1000</code> 固定基准画布、<code>ResizeObserver</code> 档位计算和 CSS <code>zoom</code> 整页缩放，改为正常流式桌面容器：<code>min-height: 100vh</code>、<code>width: 100%</code>、<code>max-width: 1920px</code>，并保留 <code>min-width: 1280px</code> 作为最低操作宽度；核心列宽不再被整体缩放，文字、图标和边线由浏览器原生字号渲染，避免小数缩放导致发虚。<code>buildWorkflowSteps</code> 仍统一生成 01-09 流程顺序、状态和判定依据，<code>WorkflowStepBadge</code> / <code>PipelineLane</code> / 分镜列标题也继续共用同一套编号；但完整 <code>WorkflowOrderBar</code>、右侧素材/视频/音频/文案/参考帧需求 chips、文案依据下拉和“音频文案、抽帧参考、主体重构、产品素材池”四个状态条不再默认渲染在工作区顶部。侧边素材输入面板只负责链接/上传和任务切换，不再重复放横版原视频预览；主画布源视频工作区直接进入核心操作。讲话人、节奏和背景音分析仍写入 <code>AudioScript</code>，但不再作为“音频解析结果”卡片默认渲染；源视频工作区撤销右上“布局调节”临时面板，不再读取或写入 <code>localStorage["skg-source-workspace-layout:v1"]</code>；当前固定为左侧原视频列 380px、9:16 视频高 500px、逐句时间轴最大高 360px、参考帧池 140px、主体空态 78px；转换层不再固定拉长，按内容自然高度显示，内容过多时最多到 560px 后在自身区域内滚动；上方是按 9:16 显示的竖版原视频播放器，播放器内覆盖“当前点抽帧”，按当前播放秒数手动补参考帧，播放器下方是逐句时间轴，英文和中文都最多显示两行；右侧上方是无标题的波形与切点参考框，下方主体链路改为上方参考帧池 + 转换层、下方主体元素结果栏。音频波形用参考图式的连续灰色包络显示响度、停顿和密集爆点，并通过 <code>skg-audio-waveform</code> 读取明暗主题变量，避免明亮模式继续使用黑底/白色波形；顶部把低/中/高密度按钮和当前播放秒数、总时长、鼠标指针停点秒数直接放在波形上方。视频播放时通过 <code>requestAnimationFrame</code> 平滑驱动波形播放线，同时同步高亮并滚动当前句；点击音频波形或字幕行会跳转原视频时间。音频波形下方同框渲染无标题的 <code>TimelineFilmstrip</code> 临时画面胶片，前端按低/中/高密度从源视频 canvas 截取预览缩略图，并按 <code>frame.time / duration</code> 的百分比定位到和波形同一条时间轴上；波形与胶片之间不显示分隔横线，胶片轨道贴近波形，缩略图轻微上下错落并倾斜重叠排列，hover 时用同一张胶片卡在原位置生成固定顶层克隆，约 4.8 倍放大并自动限制在视口内，避免被工作区、滚动容器或相邻面板遮挡；单击胶片只跳转视频时间点，不写入任务数据，双击胶片或拖进参考帧池时才调用手动抽帧并正式加入 <code>job.frames</code>，已加入的胶片显示“已添加”；胶片预览按 job、视频、密度和时长缓存，未切换低/中/高时返回页面不重新扫视频。参考帧池的主入口是“自动抽帧 12 张”，一键按动作峰值目标重新抽取 12 张源视频参考帧，优先抓手势、表情变化、节奏点和镜头变化；缩略图按竖版完整比例显示不裁切，点选状态直接叠在参考帧池缩略图上，鼠标停留会通过固定浮层放大展示完整帧。转换层改为轻量对话式生图确认区并拿到主操作宽度：左侧参考帧可点 <code>+</code> 或直接拖入转换层，本地图片拖入会通过 <code>uploadReferenceFrame</code> 保存为参考帧；转换层上方是参考输入区，下方不再显示当前要求摘要、保留元素副本或对话记录计数，只保留带张数控件的“发送消息”输入 composer；模型确认类回复不再逐条展示，生成英文 prompt 后发送区主按钮直接切换为“确认生成 N 张”，点击后才调用主体套图生成。主体元素结果栏在转换层下方，空态只占紧凑提示；有结果时按每次生成的套图文件夹显示，左侧横向展示当前套图，右侧切换套图包，保留单张重生和删除；缩略图上提供“重新生成这一张”和“删除这一张”，单张重生会用 <code>replace_views=true</code> 替换同一视角。前端对卡通重构传 <code>subject_style=cartoon_subject</code>，其他方向传 <code>subject_style=source_actor</code>；形象锁定或自主描述空文本可走 <code>reconstruction_mode=same</code>，其他参考创新走 <code>similar</code> 并把参考帧作为 <code>/images/edits</code> 的 image refs 一起提交。主体生成完成后会形成 <code>subject_consensus_brief</code>。音频结果下方是信息流复刻分镜工作台：顶部产品参考区是“同一产品素材池”，不限量上传产品图，不做不同产品身份判断；上传原图推荐长边 1200-2000px、短边至少 600px，但后端会统一生成最长边 1600px、JPEG 92 的 AI 工作副本，并回显尺寸、自动转换和风险标注；上传后按“套在脖子上的 U 形肩颈按摩仪”进行同一产品批量识别，左/右按佩戴者身体左右、上/下按佩戴方向，额外标注内外侧、开口方向、局部结构点、背景类型、用途标签、生成风险和备注，用户只检查备注，鼠标悬停通过固定浮层显示大图预览，能盖过滚动容器和分镜框架；缺视角补图失败时保留重试入口。脚本区在分镜行上方提供“作者想法”和“整片改写”，每行新口播文案可直接编辑并可单段 AI 改写。每条音频分镜默认是左侧三字段、右侧横向视频候选轨；高级区仍保留首尾帧 prompt、产品出现方式和旧 6 字段。<code>ModelTrace</code> 会在音频解析、产品识别/补图、主体重构视图包、脚本改写等入口旁直接展示模型名；生图入口会显示 <code>gpt-image-2 / gemini-3-pro-image-preview</code> 链路和短时熔断规则，点击后用固定浮层展示模型链路、输入输出和回退逻辑。旧分镜卡、抽帧控制和视频生成组件仍保留在文件里，但当前主路径不渲染。</td></tr>
@@ -619,7 +619,7 @@
                 <tr><td><code>web/components/product-library-picker.tsx</code></td><td>SKG 内置白底产品图库选择器：搜索、品类筛选、预览尺寸，并把库内图片复制为当前 job 的 <code>asset</code>。</td></tr>
                 <tr><td><code>web/components/storyboard-bar.tsx</code></td><td>顶部分镜编排条：展示选入编排的关键帧，并作为唯一分镜导航。</td></tr>
                 <tr><td><code>web/components/storyboard-workbench.tsx</code></td><td>顶部分镜编排条下方的明细区：4 图槽、改造目标、时长、自动保存。</td></tr>
-                <tr><td><code>web/lib/api.ts</code></td><td>前端类型和 API client，是前后端数据契约镜像；<code>RuntimeHealth</code> / <code>RuntimeModels</code> 读取 <code>GET /health</code>，把 ASR、翻译、视觉、图像、视频等模型名作为前端模型标注的真源，并同步承接 <code>RuntimeSizeOption</code>、图片尺寸、视频画幅、视频时长和最大单条秒数。默认首页主要使用 <code>createCreativeImageJob</code>、<code>uploadReferenceFrame</code>、<code>generateImage</code> 和 <code>generateStoryboardVideo</code>；<code>generateImage</code> 请求体现在可传 <code>size</code>。<code>generateCreativeCopy</code> 仍保留给详情页和后续高级能力。资源库相关类型和 CRUD/use/copy-to-job 函数继续保留给旧工作台和后续资源中心。</td></tr>
+                <tr><td><code>web/lib/api.ts</code></td><td>前端类型和 API client，是前后端数据契约镜像；<code>RuntimeHealth</code> / <code>RuntimeModels</code> 读取 <code>GET /health</code>，把 ASR、翻译、视觉、图像、视频等模型名作为前端模型标注的真源，并同步承接 <code>RuntimeSizeOption</code>、图片尺寸、视频画幅、视频时长和最大单条秒数。<code>GeneratedVideo</code> 额外承接 <code>queue_position</code>、<code>queue_size</code> 和 <code>queue_message</code>，用于首页和后续个人画布显示视频生成队列。默认首页主要使用 <code>createCreativeImageJob</code>、<code>uploadReferenceFrame</code>、<code>generateImage</code> 和 <code>generateStoryboardVideo</code>；<code>generateImage</code> 请求体现在可传 <code>size</code>。<code>generateCreativeCopy</code> 仍保留给详情页和后续高级能力。资源库相关类型和 CRUD/use/copy-to-job 函数继续保留给旧工作台和后续资源中心。</td></tr>
               </tbody>
             </table>
           </div>
@@ -627,7 +627,7 @@
             <h3>后端核心</h3>
             <table>
               <tbody>
-                <tr><td><code>api/main.py</code></td><td>FastAPI 单文件后端：登录会话、状态模型、任务恢复、下载、抽帧、Vision、清洗、元素、分镜、原音频转写/翻译、声音与背景音分析、后续口播改写/TTS、文件返回；同时承载全局 <code>prompt_library</code> 和 <code>asset_library</code> 的磁盘索引、CRUD、删除保护和复制到 job API。轻量创作入口 <code>POST /creative/jobs/image</code> 把上传图片或空白底图写成一个只有 0 号关键帧的 <code>Job</code>，让首页直接复用生图/生视频接口；该接口兼容无 body / JSON 空对象 / 正常 multipart 上传，避免无首帧文生图或文生视频时空 multipart 被 FastAPI 在业务前置解析阶段拒绝；<code>/health</code> 返回 <code>image_options</code>、<code>image_size_options</code>、<code>video_options</code>、<code>video_size_options</code>、<code>video_duration_options</code> 和 <code>video_max_duration_seconds</code>；<code>/frames/{idx}/generate</code> 的 <code>model</code> 字段用于图片模型偏好，<code>size</code> 字段用于图片输出尺寸；<code>/storyboard/video</code> 继续使用 <code>model</code> 字段选择视频别名，并先校验画幅与时长能力边界。旧 <code>AgentRun</code> 一键出片状态机、TK 复刻接口和 <code>POST /creative/copy</code> 继续保留。</td></tr>
+                <tr><td><code>api/main.py</code></td><td>FastAPI 单文件后端：登录会话、状态模型、任务恢复、下载、抽帧、Vision、清洗、元素、分镜、原音频转写/翻译、声音与背景音分析、后续口播改写/TTS、文件返回；同时承载全局 <code>prompt_library</code> 和 <code>asset_library</code> 的磁盘索引、CRUD、删除保护和复制到 job API。轻量创作入口 <code>POST /creative/jobs/image</code> 把上传图片或空白底图写成一个只有 0 号关键帧的 <code>Job</code>，让首页直接复用生图/生视频接口；该接口兼容无 body / JSON 空对象 / 正常 multipart 上传，避免无首帧文生图或文生视频时空 multipart 被 FastAPI 在业务前置解析阶段拒绝；<code>/health</code> 返回 <code>image_options</code>、<code>image_size_options</code>、<code>video_options</code>、<code>video_size_options</code>、<code>video_duration_options</code> 和 <code>video_max_duration_seconds</code>；<code>/frames/{idx}/generate</code> 的 <code>model</code> 字段用于图片模型偏好，<code>size</code> 字段用于图片输出尺寸；<code>/storyboard/video</code> 继续使用 <code>model</code> 字段选择视频别名，并先校验画幅与时长能力边界，然后把 <code>GeneratedVideo</code> 写成 <code>queued</code> 占位并进入进程内视频队列。队列默认 <code>VIDEO_QUEUE_MAX_CONCURRENT=2</code>、<code>VIDEO_QUEUE_MAX_CONCURRENT_PER_USER=1</code>，同一用户连续提交不会占满全局并发；排队任务会回写 <code>queue_position</code>、<code>queue_size</code>、<code>queue_message</code>。旧 <code>AgentRun</code> 一键出片状态机、TK 复刻接口和 <code>POST /creative/copy</code> 继续保留。</td></tr>
                 <tr><td><code>api/product_library/skg-products</code></td><td>内置 SKG 白底产品图库：<code>manifest.json</code> 记录从桌面产品图筛出的 gallery 白底图和桌面 4 张产品角度图，<code>images/</code> 存 45 张参考图。</td></tr>
                 <tr><td><code>api/character_library/skg-characters</code></td><td>内置相似主体形象库：从桌面 5 套策划形象导入，<code>manifest.json</code> 记录运动阳光男、都市型男、优雅白领女、运动辣妹、绅士大叔，每套含 7 张透明骨架参考图和一段 <code>prompt_brief</code>。相似主体生成时优先使用文字 brief 作为创意方向，避免把内置图作为强参考图复制。</td></tr>
                 <tr><td><code>asset_library/</code></td><td>全局素材库目录，和 <code>jobs/</code> 平级，不写入任何 job state。四类目录为 <code>subjects</code>、<code>products</code>、<code>scenes</code>、<code>videos</code>；每个素材自带 <code>manifest.json</code> 和图片/视频文件，<code>index.json</code> 只是启动扫描重建出来的缓存。库素材选用到 job 时必须复制文件到 <code>jobs/&lt;jobId&gt;/assets</code> 或 <code>storyboard-videos</code>，禁止直接保存 library 引用。</td></tr>
@@ -1183,6 +1183,19 @@ ProductRefStateItem {
         <h2>变更记录</h2>
         <p>这个记录不是 git log 的替代品。它记录“产品理解发生了什么变化、影响了哪些源码、你以后描述需求时该怎么说”。后续每次改功能都要补一条。</p>
         <div class="changelog">
+          <article class="change">
+            <header>
+              <h3>2026-05-25 · 视频生成进入个人公平队列</h3>
+              <span class="tag blue">Backend</span>
+              <span class="tag rose">UI</span>
+              <span class="tag amber">Queue</span>
+            </header>
+            <div class="body">
+              <p><strong>问题：</strong>多人使用时，如果视频提交后直接开后台线程，单个用户连续提交多个视频可能占满生成通道，其他人也看不清自己的任务是在排队还是已经生成。</p>
+              <p><strong>改动：</strong><code>api/main.py</code> 新增进程内视频队列：全局默认同时 2 个视频生成、单用户同时 1 个视频生成；<code>GeneratedVideo</code> 增加 <code>queue_position</code>、<code>queue_size</code>、<code>queue_message</code>，排队、启动、完成、失败和删除都会回写状态。<code>web/app/page.tsx</code> 把首页视频结果卡的英文状态改成“排队中 / 前方 N 个任务 / 你的上一个视频生成中 / 生成中 N% / 可播放”。</p>
+              <p><strong>影响：</strong>当前只做个人队列反馈，不做团队共享或管理员总览。队列是单 API 容器内存队列，不依赖 Redis；容器重启后未完成视频会标记为失败并提示重新生成。</p>
+            </div>
+          </article>
           <article class="change">
             <header>
               <h3>2026-05-25 · 首页完成视频结果卡直接可播放</h3>
diff --git a/web/app/page.tsx b/web/app/page.tsx
index 82977ab..f457929 100644
--- a/web/app/page.tsx
+++ b/web/app/page.tsx
@@ -96,6 +96,17 @@ function videoSrc(job: Job, video: GeneratedVideo) {
   return apiAssetUrl(video.url || `/jobs/${job.id}/storyboard-videos/${video.id}.mp4`)
 }
 
+function videoStatusText(video: GeneratedVideo) {
+  if (video.status === "queued") {
+    return video.queue_message || (video.queue_position && video.queue_position > 1 ? `排队中 · 前方 ${video.queue_position - 1} 个任务` : "排队中 · 即将开始")
+  }
+  if (video.status === "in_progress") {
+    return video.queue_message ? `${video.queue_message} · ${Math.round(video.progress)}%` : `生成中 · ${Math.round(video.progress)}%`
+  }
+  if (video.status === "completed") return `${Math.round(video.duration)}s · 可播放`
+  return "失败 · 可重试"
+}
+
 function isVideoMode(mode: CreationMode) {
   return mode !== "text-image"
 }
@@ -307,7 +318,7 @@ export default function Home() {
         model: videoModel,
       })
       setJob(updated)
-      toast.success("视频已提交")
+      toast.success("已加入生成队列")
     } catch (e) {
       const message = e instanceof Error ? e.message : "生视频失败"
       setError(message)
@@ -523,21 +534,29 @@ export default function Home() {
                   {job ? <a href={`/detail/?job=${job.id}`} className="text-xs font-semibold text-cyan-200/82 hover:text-cyan-100">打开详情页</a> : null}
                 </div>
                 {latestVideo && job ? (
-                  <MediaAssetTile
-                    kind="video"
-                    src={latestVideo.status === "completed" ? videoSrc(job, latestVideo) : undefined}
-                    poster={apiAssetUrl(latestVideo.poster_url)}
-                    objectFit="cover"
-                    previewObjectFit="contain"
-                    className="aspect-video w-full rounded-xl"
-                    videoControls={latestVideo.status === "completed"}
-                    label={latestVideo.model}
-                    meta={`${latestVideo.status} · ${Math.round(latestVideo.progress)}%`}
-                    previewDetail={latestVideo.error || undefined}
-                    emptyText={latestVideo.status === "failed" ? "失败" : undefined}
-                    busy={latestVideo.status === "queued" || latestVideo.status === "in_progress"}
-                    onDelete={() => deleteVideo(latestVideo)}
-                  />
+                  <div className="grid gap-2">
+                    {latestVideo.status === "queued" || latestVideo.status === "in_progress" ? (
+                      <div className="flex items-center justify-between gap-3 rounded-xl border border-cyan-200/12 bg-cyan-200/8 px-3 py-2 text-xs text-cyan-50/78">
+                        <span>{videoStatusText(latestVideo)}</span>
+                        {latestVideo.status === "queued" && latestVideo.queue_size ? <span className="text-cyan-100/46">队列 {latestVideo.queue_position || 0}/{latestVideo.queue_size}</span> : null}
+                      </div>
+                    ) : null}
+                    <MediaAssetTile
+                      kind="video"
+                      src={latestVideo.status === "completed" ? videoSrc(job, latestVideo) : undefined}
+                      poster={apiAssetUrl(latestVideo.poster_url)}
+                      objectFit="cover"
+                      previewObjectFit="contain"
+                      className="aspect-video w-full rounded-xl"
+                      videoControls={latestVideo.status === "completed"}
+                      label={latestVideo.model}
+                      meta={videoStatusText(latestVideo)}
+                      previewDetail={latestVideo.error || undefined}
+                      emptyText={latestVideo.status === "failed" ? "失败" : undefined}
+                      busy={latestVideo.status === "queued" || latestVideo.status === "in_progress"}
+                      onDelete={() => deleteVideo(latestVideo)}
+                    />
+                  </div>
                 ) : latestImage ? (
                   <MediaAssetTile
                     src={apiAssetUrl(latestImage.url)}
diff --git a/web/lib/api.ts b/web/lib/api.ts
index aea4920..5b23cea 100644
--- a/web/lib/api.ts
+++ b/web/lib/api.ts
@@ -252,6 +252,9 @@ export interface GeneratedVideo {
   progress: number
   error?: string
   created_at: number
+  queue_position?: number
+  queue_size?: number
+  queue_message?: string
 }
 
 export interface RuntimeModelOption {