From 7e763cf51bf393656d37155f7f8eebfd282bef71 Mon Sep 17 00:00:00 2001
From: kang <wankang2050@gmail.com>
Date: Wed, 20 May 2026 15:27:57 +0800
Subject: [PATCH] feat: add confirmed subject conversion flow

---
 RULES.md                               |   2 +-
 docs/source-analysis.html              |  24 ++-
 web/components/ad-recreation-board.tsx | 275 ++++++++++++++++++++++++-
 3 files changed, 284 insertions(+), 17 deletions(-)

diff --git a/RULES.md b/RULES.md
index b1431cb..7eb427f 100644
--- a/RULES.md
+++ b/RULES.md
@@ -11,7 +11,7 @@
 - 详见 `CLAUDE.md` 立项决策段 + `.memory/plan.md` 七步管线拆解
 - 风格：`04-Dark-Gallery-Ambient`（路径：`~/Projects/research/20260305-网页风格库/04-Dark-Gallery-Ambient.md`）
 - 第一冲刺：步骤 1-4（下载 / 拆轨 / 关键帧 / ASR+翻译）
-- 当前产品方向（2026-05-20 再确认）：信息流广告快速复刻默认进入“三字段候选生成”工作流。主界面为“左侧素材输入列 + 右侧信息流复刻工作表”。用户粘贴 TK 链接或上传视频后点击“开始分析”，系统自动下载源视频；下载完成后并行启动两条路：音频文案路提取原音频文案/字幕，并分析讲话人、语速节奏、背景音乐/环境声/音效；视频视觉路自动抽取参考帧。源视频工作区右侧主体链路是“参考帧池 → 转换层 → 主体元素”：参考帧池竖向排列；转换层当前先清空为待重构占位，不再承接拖拽、模型选择、对话、分析或生成按钮；右侧主体元素区的套图输出、文件夹分组、单张重生、删除和 hover 预览逻辑保持不变。旧下方“相似主体 / 主体模板库”不再作为主路径。波形下方的画面胶片只是临时预览，点击只跳转原视频时间点，双击或拖进参考帧池才正式加入关键帧，已加入的胶片直接显示“已添加”。产品图上传后独立形成产品资产包，自动识别视角/结构/比例并补缺角度。分镜工作台按逐句时间轴默认只露“文案 / 场景一句话 / 人物+产品+动作”，产品素材池、批量控制、三字段、视频候选和高级区都必须可折叠；视频候选无内容时默认不占大面积，有候选时默认只显示迷你缩略条，展开后才显示 4-grid。单条默认生成 4 个视频候选，顶部支持整片批量生成候选；首尾帧、视觉规划、产品出现方式和旧 6 字段保留在“高级”抽屉与后端 quick-plan 自动展开中，不能再作为客户默认闸门。
+- 当前产品方向（2026-05-20 再确认）：信息流广告快速复刻默认进入“三字段候选生成”工作流。主界面为“左侧素材输入列 + 右侧信息流复刻工作表”。用户粘贴 TK 链接或上传视频后点击“开始分析”，系统自动下载源视频；下载完成后并行启动两条路：音频文案路提取原音频文案/字幕，并分析讲话人、语速节奏、背景音乐/环境声/音效；视频视觉路自动抽取参考帧。源视频工作区右侧主体链路是“参考帧池 → 转换层 → 主体元素”：参考帧池竖向排列；转换层是轻量对话式生图确认区，参考帧通过左侧缩略图 `+` 送入转换层，用户选择 GPT/Gemini 套件后先分析参考图，再用对话描述复刻/创新/卡通/数量和画面要求；后端返回英文出图 prompt 后必须弹窗确认，用户点确认才生成对应数量的统一多角度套图。右侧主体元素区的套图输出、文件夹分组、单张重生、删除和 hover 预览逻辑保持不变。旧下方“相似主体 / 主体模板库”不再作为主路径。波形下方的画面胶片只是临时预览，点击只跳转原视频时间点，双击或拖进参考帧池才正式加入关键帧，已加入的胶片直接显示“已添加”。产品图上传后独立形成产品资产包，自动识别视角/结构/比例并补缺角度。分镜工作台按逐句时间轴默认只露“文案 / 场景一句话 / 人物+产品+动作”，产品素材池、批量控制、三字段、视频候选和高级区都必须可折叠；视频候选无内容时默认不占大面积，有候选时默认只显示迷你缩略条，展开后才显示 4-grid。单条默认生成 4 个视频候选，顶部支持整片批量生成候选；首尾帧、视觉规划、产品出现方式和旧 6 字段保留在“高级”抽屉与后端 quick-plan 自动展开中，不能再作为客户默认闸门。
 
 ## 部署事实
 - 平台：VPS `76.13.31.179`（Ubuntu 24.04 / Docker Compose / Coolify Traefik）
diff --git a/docs/source-analysis.html b/docs/source-analysis.html
index b3e55fd..07f1c25 100644
--- a/docs/source-analysis.html
+++ b/docs/source-analysis.html
@@ -569,7 +569,7 @@
 
       <section id="pipeline" data-search>
         <h2>业务管线</h2>
-        <p>当前产品方向已收窄为“信息流广告快速复刻”：主界面左侧是素材输入列，右侧是信息流复刻工作表。后台仍按 01-09 流程顺序计算素材任务、源视频、音频文案、抽帧、主体资产、产品资产、分镜文案、三字段规划和视频候选这些状态，但这些判断不再默认显现在工作区顶部，避免状态提示挤占首屏操作空间。用户粘贴 TK 链接或上传视频后点击“开始分析”，系统自动下载源视频；下载完成后并行启动音频文案路和视频视觉路。音频文案路提取原音频文案/字幕，分析讲话人、语速节奏、背景音乐/环境声/音效，并为后续新口播和分镜文案提供时间轴；视频视觉路同步抽取参考帧。源视频工作区右侧主体链路是“参考帧池 → 转换层 → 主体元素”：参考帧池只作为竖向原始参考；转换层当前先清空为待重构占位，不再显示参考图、模型选择、分析、对话、摘要或生成按钮，也不接收拖拽；右侧主体元素区保留已有套图输出、文件夹分组、单张重生、删除和 hover 预览逻辑。旧下方主体模板库不再作为主路径。波形下方的画面胶片由前端临时从源视频截取，密度可调，点击只跳转原视频时间点，双击或拖入参考帧池才调用手动抽帧接口正式写入关键帧；已写入的胶片显示“已添加”，相同素材、相同密度和时长下会复用内存缓存，避免返回页面时重复扫视频。产品图上传后独立形成产品资产包：自动识别视角、左右/上下/内外侧、结构点、比例和风险，并补缺角度。最终分镜规划按逐句时间轴把文案、主体元素和产品资产汇合；每条分镜默认是左侧“文案 / 场景一句话 / 人物+产品+动作”三字段、右侧横向视频候选轨。客户可直接改中文镜像，前端会调用改写/翻译链路自动优化对应英文主值；单条和整片都可选择生成数量，整片按行排队提交。首尾帧、视觉规划、产品出现方式等细节保留在高级抽屉和后端自动展开逻辑里，不再作为客户默认闸门。</p>
+        <p>当前产品方向已收窄为“信息流广告快速复刻”：主界面左侧是素材输入列，右侧是信息流复刻工作表。后台仍按 01-09 流程顺序计算素材任务、源视频、音频文案、抽帧、主体资产、产品资产、分镜文案、三字段规划和视频候选这些状态，但这些判断不再默认显现在工作区顶部，避免状态提示挤占首屏操作空间。用户粘贴 TK 链接或上传视频后点击“开始分析”，系统自动下载源视频；下载完成后并行启动音频文案路和视频视觉路。音频文案路提取原音频文案/字幕，分析讲话人、语速节奏、背景音乐/环境声/音效，并为后续新口播和分镜文案提供时间轴；视频视觉路同步抽取参考帧。源视频工作区右侧主体链路是“参考帧池 → 转换层 → 主体元素”：参考帧池只作为竖向原始参考；转换层改为轻量对话式生图确认区，参考帧通过左侧缩略图 <code>+</code> 送入转换层，用户选择 GPT/Gemini 套件后先分析参考图，再用对话描述复刻、创新、卡通、数量和画面要求；系统返回英文出图 prompt 后必须弹窗确认，用户点确认才调用主体生成并把结果送到右侧主体元素。右侧主体元素区保留已有套图输出、文件夹分组、单张重生、删除和 hover 预览逻辑。旧下方主体模板库不再作为主路径。波形下方的画面胶片由前端临时从源视频截取，密度可调，点击只跳转原视频时间点，双击或拖入参考帧池才调用手动抽帧接口正式写入关键帧；已写入的胶片显示“已添加”，相同素材、相同密度和时长下会复用内存缓存，避免返回页面时重复扫视频。产品图上传后独立形成产品资产包：自动识别视角、左右/上下/内外侧、结构点、比例和风险，并补缺角度。最终分镜规划按逐句时间轴把文案、主体元素和产品资产汇合；每条分镜默认是左侧“文案 / 场景一句话 / 人物+产品+动作”三字段、右侧横向视频候选轨。客户可直接改中文镜像，前端会调用改写/翻译链路自动优化对应英文主值；单条和整片都可选择生成数量，整片按行排队提交。首尾帧、视觉规划、产品出现方式等细节保留在高级抽屉和后端自动展开逻辑里，不再作为客户默认闸门。</p>
         <div class="pipeline">
           <div class="step"><div class="num">01</div><h3>素材输入</h3><p>有当前素材任务即通过；输入框只负责创建或切换任务。</p></div>
           <div class="step"><div class="num">02</div><h3>源视频下载</h3><p><code>job.video_url</code> 存在即通过；<code>created/downloading</code> 视为运行中。公开视频默认不带 cookies 下载；只有 TikTok 明确要求登录态时才配置 <code>YTDLP_COOKIES_FILE</code>，生产容器禁止使用 <code>YTDLP_COOKIES_FROM_BROWSER=chrome</code>。</p></div>
@@ -593,8 +593,8 @@
                 <tr><td><code>web/next.config.mjs</code></td><td>Next.js 构建配置：静态导出、图片不走优化、禁用开发环境左下角 Next Dev Indicator，并移除 Next 16 已不支持的 <code>eslint</code> 顶层配置，避免本地 dev 出现配置 Issue 提示。</td></tr>
                 <tr><td><code>web/app/globals.css</code></td><td>全局主题变量、登录页视觉样式、信息流工作台同源品牌 token、ReactFlow 样式引用，以及本地开发态 <code>nextjs-portal</code> 遮挡隐藏规则。工作台在 <code>skg-board-theme</code> 内定义 <code>--skg-gold-1</code>、<code>--skg-gold-2</code>、<code>--skg-cream</code>、<code>--skg-bg-*</code>、<code>--skg-text-*</code>、<code>--skg-radius-*</code> 和按钮阴影等变量，并新增 <code>skg-board-brand</code>、<code>skg-stat-card</code>、<code>skg-primary-action</code>、<code>skg-secondary-action</code>、<code>skg-empty-state</code> 等样式。暗色工作台复用登录页金色聚焦、米白主按钮和弱暖光氛围；明亮模式通过 <code>skg-board-theme--light</code> 复用同一套结构，改成暖白底、白色 panel、黑底主 CTA 和深色文本，不另起一套界面。</td></tr>
                 <tr><td><code>web/app/page.tsx</code></td><td>产品工作台主状态：jobs、activeJobId、生成任务状态；主渲染为全屏素材输入列 + 信息流广告复刻工作表；“开始分析”会把 job 放入并行素材分析队列，下载完成后触发 <code>triggerTranscribe</code> 解析音频，并触发 <code>analyzeJob</code> 自动抽 12 张参考帧，形成“音频文案路 + 视频视觉路”同步推进；音频失败时会忽略失败状态下残留的半成品 transcript，允许再次触发音频解析；底部吸附音频条和旧全局浮动主题按钮不再从主界面渲染，避免和工作台内的明暗模式切换重复。</td></tr>
-                <tr><td><code>web/components/ad-recreation-board.tsx</code></td><td>信息流广告复刻工作表：顶部先展示与登录页连续的 SKG brand strip，包含 SKG 字标、“未来健康 · 营销内容工作台”和“营销内容工作台 · TK 二创”；右侧素材/任务/视频/文案统计改为米白 stat 卡片，主动作按钮统一走 <code>skg-primary-action</code>，次动作走 <code>skg-secondary-action</code>，空状态复用 <code>AnimatedLoginCharacters</code>。<code>buildWorkflowSteps</code> 仍统一生成 01-09 流程顺序、状态和判定依据，<code>WorkflowStepBadge</code> / <code>PipelineLane</code> / 分镜列标题也继续共用同一套编号；但完整 <code>WorkflowOrderBar</code>、右侧素材/视频/音频/文案/参考帧需求 chips、文案依据下拉和“音频文案、抽帧参考、主体重构、产品素材池”四个状态条不再默认渲染在工作区顶部。左侧素材输入只负责链接/上传和任务切换，不再重复放横版原视频预览；右侧源视频工作区直接进入核心操作。讲话人、节奏和背景音分析仍写入 <code>AudioScript</code>，但不再作为“音频解析结果”卡片默认渲染；主工作区左侧宽度调整为 430-460px，上方是按 9:16 显示的竖版原视频播放器，播放器内覆盖“当前点抽帧”，按当前播放秒数手动补参考帧，播放器下方是逐句时间轴，英文和中文都最多显示两行；右侧上方是无标题的波形与切点参考框，下方是三栏主体管线。音频波形用参考图式的连续灰色包络显示响度、停顿和密集爆点，顶部把低/中/高密度按钮和当前播放秒数、总时长、鼠标指针停点秒数直接放在波形上方。视频播放时通过 <code>requestAnimationFrame</code> 平滑驱动波形播放线，同时同步高亮并滚动当前句；点击音频波形或字幕行会跳转原视频时间。音频波形下方同框渲染无标题的 <code>TimelineFilmstrip</code> 临时画面胶片，前端按低/中/高密度从源视频 canvas 截取预览缩略图，并按 <code>frame.time / duration</code> 的百分比定位到和波形同一条时间轴上；波形与胶片之间不显示分隔横线，胶片轨道贴近波形，缩略图轻微上下错落并倾斜重叠排列，hover 时用同一张胶片卡在原位置生成固定顶层克隆，约 4.8 倍放大并自动限制在视口内，避免被工作区、滚动容器或相邻面板遮挡；单击胶片只跳转原视频时间，不写入任务数据，双击胶片或拖进参考帧池时才调用手动抽帧并正式加入 <code>job.frames</code>，已加入的胶片显示“已添加”；胶片预览按 job、视频、密度和时长缓存，未切换低/中/高时返回页面不重新扫视频。右侧参考帧池的主入口是“自动抽帧 12 张”，一键按动作峰值目标重新抽取 12 张源视频参考帧，优先抓手势、表情变化、节奏点和镜头变化；缩略图按竖版完整比例显示不裁切，点选状态直接叠在参考帧池缩略图上，鼠标停留会通过固定浮层放大展示完整帧。转换层当前先清空为待重构占位，不再展示参考图、模型选择、分析、对话、摘要或生成按钮，也不接收拖拽；右侧主体元素区仍按每次生成的套图文件夹显示结果，保留单张重生和删除。主体元素区按每次生成的套图文件夹显示结果；缩略图上提供“重新生成这一张”和“删除这一张”，单张重生会用 <code>replace_views=true</code> 替换同一视角。前端对卡通重构传 <code>subject_style=cartoon_subject</code>，其他方向传 <code>subject_style=source_actor</code>；形象锁定或自主描述空文本可走 <code>reconstruction_mode=same</code>，其他参考创新走 <code>similar</code> 并把参考帧作为 <code>/images/edits</code> 的 image refs 一起提交。主体生成完成后会形成 <code>subject_consensus_brief</code>。音频结果下方是信息流复刻分镜工作台：顶部产品参考区是“同一产品素材池”，不限量上传产品图，不做不同产品身份判断；上传原图推荐长边 1200-2000px、短边至少 600px，但后端会统一生成最长边 1600px、JPEG 92 的 AI 工作副本，并回显尺寸、自动转换和风险标注；上传后按“套在脖子上的 U 形肩颈按摩仪”进行同一产品批量识别，左/右按佩戴者身体左右、上/下按佩戴方向，额外标注内外侧、开口方向、局部结构点、背景类型、用途标签、生成风险和备注，用户只检查备注，鼠标悬停通过固定浮层显示大图预览，能盖过滚动容器和分镜框架；缺视角补图失败时保留重试入口。脚本区在分镜行上方提供“作者想法”和“整片改写”，每行新口播文案可直接编辑并可单段 AI 改写。每条音频分镜默认是左侧三字段、右侧横向视频候选轨；高级区仍保留首尾帧 prompt、产品出现方式和旧 6 字段。<code>ModelTrace</code> 会在音频解析、产品识别/补图、主体重构视图包、脚本改写等入口旁直接展示模型名；生图入口会显示 <code>gpt-image-2 / gemini-3-pro-image-preview</code> 链路和短时熔断规则，点击后用固定浮层展示模型链路、输入输出和回退逻辑。旧分镜卡、抽帧控制和视频生成组件仍保留在文件里，但当前主路径不渲染。</td></tr>
-                <tr><td><code>SourceSubjectPipeline</code></td><td>源视频工作区右侧主体管线主路径：三栏分别是竖向 <strong>参考帧池</strong>、<strong>转换层</strong> 和 <strong>主体元素</strong>。参考帧池保留自动 12 张、胶片拖入正式成帧、点击勾选和删除；参考帧缩略图保持小尺寸固定宽度、<code>aspect-[9/16]</code> 和 <code>object-contain</code> 显示，hover 预览通过 <code>MediaAssetTile</code> 的左侧紧凑浮层显示。转换层当前先清空为待重构占位：只保留标题和空白区域，不再展示参考图、模型选择、分析、对话、摘要或生成按钮，也不接收拖拽。既有 <code>subject-agent/analyze</code>、<code>subject-agent/message</code> 和 <code>generateSubjectAssets</code> 逻辑暂时保留在代码里，避免影响右侧主体元素已有套图、轮询、重生和删除链路。后端会为每次主体套图注入同一份 pack bible：参考创新模式锁定同一个全新主体和同一套服装，源形象锁定模式锁定参考帧里的可见主体、体态、发型、服装和配色；后处理会裁出白底主体并允许放大到画布高度上限约 96%，实测典型主体有效高度约 90%，避免模型生成“小人 + 大白边”。主体元素区按每次生成的 <code>pack_id</code> 组织成“套图文件夹”：顶部展开当前选中套图，下面是可滚动的套图包列表；同一方向可保留多套，生成中按 pack 显示 <code>2/6</code> 这类进度，单张完成就替换对应占位卡。缩略图复用 <code>MediaAssetTile</code>，支持 hover 放大、单张重生和删除。旧下方 <code>SourceReferenceBuildPanel</code> 不再主路径渲染。</td></tr>
+                <tr><td><code>web/components/ad-recreation-board.tsx</code></td><td>信息流广告复刻工作表：顶部先展示与登录页连续的 SKG brand strip，包含 SKG 字标、“未来健康 · 营销内容工作台”和“营销内容工作台 · TK 二创”；右侧素材/任务/视频/文案统计改为米白 stat 卡片，主动作按钮统一走 <code>skg-primary-action</code>，次动作走 <code>skg-secondary-action</code>，空状态复用 <code>AnimatedLoginCharacters</code>。<code>buildWorkflowSteps</code> 仍统一生成 01-09 流程顺序、状态和判定依据，<code>WorkflowStepBadge</code> / <code>PipelineLane</code> / 分镜列标题也继续共用同一套编号；但完整 <code>WorkflowOrderBar</code>、右侧素材/视频/音频/文案/参考帧需求 chips、文案依据下拉和“音频文案、抽帧参考、主体重构、产品素材池”四个状态条不再默认渲染在工作区顶部。左侧素材输入只负责链接/上传和任务切换，不再重复放横版原视频预览；右侧源视频工作区直接进入核心操作。讲话人、节奏和背景音分析仍写入 <code>AudioScript</code>，但不再作为“音频解析结果”卡片默认渲染；主工作区左侧宽度调整为 430-460px，上方是按 9:16 显示的竖版原视频播放器，播放器内覆盖“当前点抽帧”，按当前播放秒数手动补参考帧，播放器下方是逐句时间轴，英文和中文都最多显示两行；右侧上方是无标题的波形与切点参考框，下方是三栏主体管线。音频波形用参考图式的连续灰色包络显示响度、停顿和密集爆点，顶部把低/中/高密度按钮和当前播放秒数、总时长、鼠标指针停点秒数直接放在波形上方。视频播放时通过 <code>requestAnimationFrame</code> 平滑驱动波形播放线，同时同步高亮并滚动当前句；点击音频波形或字幕行会跳转原视频时间。音频波形下方同框渲染无标题的 <code>TimelineFilmstrip</code> 临时画面胶片，前端按低/中/高密度从源视频 canvas 截取预览缩略图，并按 <code>frame.time / duration</code> 的百分比定位到和波形同一条时间轴上；波形与胶片之间不显示分隔横线，胶片轨道贴近波形，缩略图轻微上下错落并倾斜重叠排列，hover 时用同一张胶片卡在原位置生成固定顶层克隆，约 4.8 倍放大并自动限制在视口内，避免被工作区、滚动容器或相邻面板遮挡；单击胶片只跳转原视频时间，不写入任务数据，双击胶片或拖进参考帧池时才调用手动抽帧并正式加入 <code>job.frames</code>，已加入的胶片显示“已添加”；胶片预览按 job、视频、密度和时长缓存，未切换低/中/高时返回页面不重新扫视频。右侧参考帧池的主入口是“自动抽帧 12 张”，一键按动作峰值目标重新抽取 12 张源视频参考帧，优先抓手势、表情变化、节奏点和镜头变化；缩略图按竖版完整比例显示不裁切，点选状态直接叠在参考帧池缩略图上，鼠标停留会通过固定浮层放大展示完整帧。转换层改为轻量对话式生图确认区：左侧参考帧可点 + 送入，转换层内选择 GPT/Gemini 套件、分析参考图、通过对话生成英文 prompt，并在固定弹窗里确认后才调用主体套图生成；右侧主体元素区仍按每次生成的套图文件夹显示结果，保留单张重生和删除。主体元素区按每次生成的套图文件夹显示结果；缩略图上提供“重新生成这一张”和“删除这一张”，单张重生会用 <code>replace_views=true</code> 替换同一视角。前端对卡通重构传 <code>subject_style=cartoon_subject</code>，其他方向传 <code>subject_style=source_actor</code>；形象锁定或自主描述空文本可走 <code>reconstruction_mode=same</code>，其他参考创新走 <code>similar</code> 并把参考帧作为 <code>/images/edits</code> 的 image refs 一起提交。主体生成完成后会形成 <code>subject_consensus_brief</code>。音频结果下方是信息流复刻分镜工作台：顶部产品参考区是“同一产品素材池”，不限量上传产品图，不做不同产品身份判断；上传原图推荐长边 1200-2000px、短边至少 600px，但后端会统一生成最长边 1600px、JPEG 92 的 AI 工作副本，并回显尺寸、自动转换和风险标注；上传后按“套在脖子上的 U 形肩颈按摩仪”进行同一产品批量识别，左/右按佩戴者身体左右、上/下按佩戴方向，额外标注内外侧、开口方向、局部结构点、背景类型、用途标签、生成风险和备注，用户只检查备注，鼠标悬停通过固定浮层显示大图预览，能盖过滚动容器和分镜框架；缺视角补图失败时保留重试入口。脚本区在分镜行上方提供“作者想法”和“整片改写”，每行新口播文案可直接编辑并可单段 AI 改写。每条音频分镜默认是左侧三字段、右侧横向视频候选轨；高级区仍保留首尾帧 prompt、产品出现方式和旧 6 字段。<code>ModelTrace</code> 会在音频解析、产品识别/补图、主体重构视图包、脚本改写等入口旁直接展示模型名；生图入口会显示 <code>gpt-image-2 / gemini-3-pro-image-preview</code> 链路和短时熔断规则，点击后用固定浮层展示模型链路、输入输出和回退逻辑。旧分镜卡、抽帧控制和视频生成组件仍保留在文件里，但当前主路径不渲染。</td></tr>
+                <tr><td><code>SourceSubjectPipeline</code></td><td>源视频工作区右侧主体管线主路径：三栏分别是竖向 <strong>参考帧池</strong>、<strong>转换层</strong> 和 <strong>主体元素</strong>。参考帧池保留自动 12 张、胶片拖入正式成帧、点击勾选和删除；参考帧缩略图保持小尺寸固定宽度、<code>aspect-[9/16]</code> 和 <code>object-contain</code> 显示，hover 预览通过 <code>MediaAssetTile</code> 的左侧紧凑浮层显示，并新增 <code>+</code> 操作把参考帧送入转换层。转换层是轻量对话式生图确认区：顶部选择 GPT 套件或 Gemini 套件，中部展示最多 3 张参考图和“分析参考图”，下方是生图对话、快捷需求、输入框和“生成提示词”；<code>subject-agent/message</code> 返回英文 <code>generation_prompt_en</code> 后先显示待确认 prompt，并通过固定弹窗展示用户要求、最终英文提示词、模型套件、方向和数量，用户点“确定生成”才调用 <code>generateSubjectAssets</code>。后端会为每次主体套图注入同一份 pack bible：参考创新模式锁定同一个全新主体和同一套服装，源形象锁定模式锁定参考帧里的可见主体、体态、发型、服装和配色；后处理会裁出白底主体并允许放大到画布高度上限约 96%，实测典型主体有效高度约 90%，避免模型生成“小人 + 大白边”。主体元素区按每次生成的 <code>pack_id</code> 组织成“套图文件夹”：顶部展开当前选中套图，下面是可滚动的套图包列表；同一方向可保留多套，生成中按 pack 显示 <code>2/6</code> 这类进度，单张完成就替换对应占位卡。缩略图复用 <code>MediaAssetTile</code>，支持 hover 放大、单张重生和删除。旧下方 <code>SourceReferenceBuildPanel</code> 不再主路径渲染。</td></tr>
                 <tr><td><code>AudioStoryboardPlanPanel</code> 三字段候选生成</td><td>当前分镜主路径：每行是左右双栏，左侧默认显示 <code>skg_copy_*</code>、<code>scene_one_line_*</code>、<code>action_one_line_*</code> 三组中英字段，右侧直接显示视频候选横向轨。用户改中文镜像后，字段失焦会通过 <code>refineStoryboard</code> 优化对应英文主值，失败时退回 <code>translateText</code>；英文仍是后续 prompt 主值。<code>quickPlanStoryboard</code> 把三字段和主体 brief 展开为完整 <code>StoryboardScene</code>，<code>generateStoryboardVideo</code> 的 <code>count</code> 可由单行数字控件选择，候选新生成后持续向右追加，不再用 4-grid 撑高每行。整片生成同样可选择每行数量，并以 <code>concurrency=1</code> 按行排队提交。产品素材池、批量控制、每行主体区和高级区都可折叠，高级抽屉仍展示旧 6 字段、首尾帧 prompt 和首尾帧资产槽，但客户默认不用先处理首尾帧。</td></tr>
                 <tr><td><code>web/components/resource-library/library-drawer.tsx</code></td><td>全局资源中心浮窗：由工作台顶部“资源库”按钮打开，叠加在工作台上方但不阻塞主界面；尺寸、位置和当前 Tab 写入 <code>localStorage["skg-resource-library-drawer"]</code>。提示词 Tab 固定 5 列（场景描述、视频描述、主体描述、SKG 文案、产品角度），每列先显示 use_count 排名前 5 的“常用”，再按月份倒序分组；提示词节点常驻复制按钮，hover 可选英文/中文/双语复制，并调用 use 接口。素材 Tab 固定 4 列（主体、产品、场景、视频），节点不可拖动，按月份倒序硬编码排列；“应用到当前 job”只调用后端复制接口，得到普通 <code>ImageRef(kind="asset")</code> 后再写入产品素材池或复制 ID。浮窗顶部最近 24 小时横条混合显示提示词和素材；新建提示词、上传素材、删除前查引用、详情侧栏都在该组件内完成。</td></tr>
                 <tr><td><code>AdRecreationBoard</code> 主题切换</td><td>顶部指标区左侧有“明亮/暗色”按钮，使用 <code>Sun</code> / <code>Moon</code> 图标切换 <code>skg-board-theme--light</code> 类名，并把选择写入 <code>localStorage["skg-board-theme"]</code>。暗色仍是默认模式；明亮模式只改变工作台外观，不改变任务、素材、分镜、模型调用或接口数据。</td></tr>
@@ -640,7 +640,7 @@ web/app/page.tsx
   -> 信息流广告复刻工作表：web/components/ad-recreation-board.tsx
   -> 开始分析：创建/激活 job → 下载完成后并行触发视频视觉路 analyzeJob 与音频文案路 triggerTranscribe
   -> 后台流程判定：01 素材输入 → 02 源视频下载 → 03 音频文案 → 04 抽帧参考 → 05 主体重构 → 06 产品素材池 → 07 分镜文案 → 08 三字段规划 → 09 视频候选；每步从 buildWorkflowSteps 取判定依据和状态，但默认不渲染完整状态条
-  -> 左侧素材输入列 + 源视频工作区（竖版 9:16 原视频播放器放大并内置当前点抽帧，逐句时间轴移到原版视频下方，英文/中文最多两行显示；右侧上方连续响度波形显示当前/总时长/指针停点，波形下方是可调低/中/高密度的临时画面胶片，单击仅跳转、双击或拖入参考帧池才正式选帧，并复用同密度胶片缓存；右侧下方是三栏主体管线：参考帧池竖排、转换层待重构占位、主体元素展示生成结果；旧相似主体 / 主体模板区不再主路径渲染；讲话人/节奏/背景音分析写入数据但不默认显示成卡片）
+  -> 左侧素材输入列 + 源视频工作区（竖版 9:16 原视频播放器放大并内置当前点抽帧，逐句时间轴移到原版视频下方，英文/中文最多两行显示；右侧上方连续响度波形显示当前/总时长/指针停点，波形下方是可调低/中/高密度的临时画面胶片，单击仅跳转、双击或拖入参考帧池才正式选帧，并复用同密度胶片缓存；右侧下方是三栏主体管线：参考帧池竖排、转换层负责参考图分析/对话/提示词确认、主体元素展示生成结果；旧相似主体 / 主体模板区不再主路径渲染；讲话人/节奏/背景音分析写入数据但不默认显示成卡片）
   -> 信息流复刻分镜工作台：06 同一产品素材池不限量上传 → 自动识别视角 / 背景 / 用途 / 风险 → 人工检查备注 → 07 逐句时间轴 / 原内容 / 新口播文案 → 08 紧凑三字段（文案、场景一句话、人物+产品+动作；可折叠）→ quick-plan 自动展开高级字段 → 单条生成 4 个视频候选 / 收起态迷你缩略条 / 展开态 4-grid / 追加生成 / 选中候选 → 09 整片一键后台批量提交
   -> 底部音频条：不再渲染，音频结果集中到右侧工作表
   -> 旧节点/深度素材面板：web/components/nodes/index.tsx、web/components/lightbox.tsx、web/components/storyboard-workbench.tsx（底层保留，当前不作为主入口）
@@ -728,7 +728,7 @@ api/main.py
           </div>
           <div class="card">
             <h3>SubjectAgentState</h3>
-            <p>历史转换层生图对话的项目内记忆。它仍跟随 <code>Job</code> 写入 <code>state.json</code>，用于兼容旧任务；当前主界面的转换层已清空为待重构占位，暂不从 UI 更新这些字段。</p>
+            <p>转换层生图对话的项目内记忆。它跟随 <code>Job</code> 写入 <code>state.json</code>，保存当前参考帧、模型套件、识别摘要、对话要求、最终英文提示词、方向和数量；主界面会用这些字段驱动提示词确认弹窗，用户确认后才生成主体套图。</p>
 <pre>SubjectAgentState {
   model_bundle: "gpt" | "gemini",
   source_frame_indices: number[],
@@ -1003,7 +1003,7 @@ ProductRefStateItem {
             <tr><td>应用清洗</td><td><code>POST /cleanup/apply</code></td><td><code>applyCleanedFrame</code></td><td>物理覆盖 frames/{idx}.jpg，并备份原图。</td></tr>
             <tr><td>元素增改删</td><td><code>POST/PATCH/DELETE /elements</code></td><td><code>addElement/updateElement/deleteElement</code></td><td>让用户修正 Vision 错误，避免候选结果锁死。</td></tr>
             <tr><td>元素提取</td><td><code>POST /elements/{element_id}/cutout</code></td><td><code>cutoutElement</code></td><td>调用图像模型生成独立白底素材图，每次累积一张 cutout。</td></tr>
-            <tr><td>转换层生图智能体</td><td><code>POST /jobs/{id}/subject-agent/analyze</code><br><code>POST /jobs/{id}/subject-agent/message</code></td><td><code>analyzeSubjectAgent</code><br><code>sendSubjectAgentMessage</code></td><td>项目内主体生图对话状态接口仍保留，但当前主界面的转换层已经清空为待重构占位，不再从 UI 调用 <code>analyze</code> 或 <code>message</code>。保留这些接口是为了不破坏既有 job 数据和后续重构时的复用可能。</td></tr>
+            <tr><td>转换层生图智能体</td><td><code>POST /jobs/{id}/subject-agent/analyze</code><br><code>POST /jobs/{id}/subject-agent/message</code></td><td><code>analyzeSubjectAgent</code><br><code>sendSubjectAgentMessage</code></td><td>转换层主路径接口：<code>analyze</code> 根据 1-3 张参考帧输出主体/服装/风格特征和 trait chips；<code>message</code> 从用户对话里识别方向、数量和要求，返回中文需求与英文 <code>generation_prompt_en</code>。前端只在用户确认 prompt 后再调用 <code>generateSubjectAssets</code> 生成右侧主体套图。</td></tr>
             <tr><td>主体资产包</td><td><code>POST /elements/{element_id}/subject-assets</code><br><code>DELETE /elements/{element_id}/subject-assets/{asset_id}</code></td><td><code>generateSubjectAssets</code><br><code>deleteSubjectAsset</code></td><td>根据转换层历史状态重新绘制统一主体资产包的接口逻辑仍保留；当前主界面的转换层 UI 已清空，不再提供新的参考帧、对话或生成提交入口，右侧主体元素区只保留已有套图输出、轮询、文件夹分组、单张重生和删除。当前源视频工作区使用 <code>subject_style=source_actor</code> 承接形象锁定、创意复刻和自主描述，使用 <code>subject_style=cartoon_subject</code> 承接对话识别出的卡通重构；旧 <code>transparent_human</code> 仍为兼容类型但不是当前转换层默认入口。<code>reconstruction_mode=similar</code> 是参考创新路径：后端先用 <code>VISION_MODEL</code> 把关键帧反推成主体 brief；只要有参考帧，就把这些帧作为 <code>/images/edits</code> 的 image refs 一起提交，日志会显示 <code>endpoint=/images/edits</code> 和 <code>image_refs&gt;0</code>，不再偷偷降级为纯文字生图。卡通重构在后端额外加入原创卡通/插画主体约束，明确不输出真实人物复制 likeness。生成完成后，后端会把生成视图反推/写入 <code>KeyElement.subject_consensus_brief</code>，作为后续首尾帧的唯一主体身份文字依据。<code>reconstruction_mode=same</code> 是源形象锁定路径：自主描述空文本或对话要求形象锁定时可使用该路径，后端把参考帧作为 primary visual evidence，尽量保留同一可见主体、体态、发型、服装和配色。每个 <code>view</code> 单独调用一次生图，明确禁止多视图拼图、contact sheet、多主体、多面板、标签或对比排版。单次图片请求受 <code>IMAGE_REQUEST_TIMEOUT_SECONDS</code> 控制，默认 60 秒；<code>gpt-image-2</code> 超时、429、5xx、DNS 或连接失败时可兜底 <code>gemini-3-pro-image-preview</code>，连续 2 次主模型上游类失败后 600 秒内短时熔断。仅当 <code>image_model_preference=auto</code> 时才启用兜底和熔断；用户显式选择 GPT 或 Gemini 时只走所选模型，方便已知某个上游不可用时直接切换。主体同一套图内一旦触发 Gemini，后续视图沿用 Gemini，避免风格混杂和重复等待主模型超时。主体 prompt 会要求从参考图继承性别、人种/肤色、年龄体态和角色气质等广义特征，但生成同一个全新主体；多视图必须保持同一脸部设定、发型、体态、服装类型、配色、材质、剪裁和配饰，不允许每个视角换衣服。后端新增 pack bible 固定字段，把主体、发型、肤色、体态、服装、鞋、配饰和禁止换装项注入每个视角；<code>_normalize_asset_image(fill_subject=true)</code> 裁白边后会按目标画布放大主体，而不是只用 <code>thumbnail()</code> 缩小，目标是让全身主体占画布高度约 88-94%。后端不再要求整包全成功才写入：单个视图失败时会保留已成功生成的主体图，返回“部分生成完成”，只有一张都没生成出来才返回错误。<code>replace_views=true</code> 时会替换同一视角旧图；删除接口会移除对应 subject asset 记录并删除本地 jpg 文件。</td></tr>
             <tr><td>主体套图状态</td><td><code>SubjectAsset.status</code><br><code>pack_id</code></td><td><code>web/app/page.tsx</code><br><code>SourceSubjectPipeline</code></td><td><code>generateSubjectAssets</code> 现在先写入同一个 <code>pack_id</code> 下的 queued 占位卡并立即返回，后台按视角逐张生成，单张完成就把该占位替换成 completed 图片。前端轮询会把 queued / in_progress 主体资产纳入运行状态；主体元素区按 pack 显示套图文件夹，点击某个文件夹后展开该套图，其他套图顺位进入下方可滚动列表。</td></tr>
             <tr><td>首尾帧资产</td><td><code>POST /frames/{idx}/scene-asset</code></td><td><code>generateSceneAsset</code></td><td>同一接口兼容旧场景图和新首尾帧；当前信息流复刻流程传 <code>asset_role=first_frame/last_frame</code>、<code>subject_brief</code> 和最多 1-2 张 <code>product_images</code>。首尾帧不再传主体图、不再把主体图和产品图拼成 contact sheet；主体只走文字 brief，允许新动作、新景别、新表情和新环境。若本条需要产品，后端只把产品参考图作为 <code>gpt-image-2</code> image-edit 的硬视觉真源；若不需要产品，则走纯文字生图。关键帧只作为行数据承载位置。生成结果保存在 <code>scene_assets</code>，前端再写入 <code>StoryboardScene.first_image/last_image</code>。</td></tr>
@@ -1131,6 +1131,18 @@ ProductRefStateItem {
         <h2>变更记录</h2>
         <p>这个记录不是 git log 的替代品。它记录“产品理解发生了什么变化、影响了哪些源码、你以后描述需求时该怎么说”。后续每次改功能都要补一条。</p>
         <div class="changelog">
+          <article class="change">
+            <header>
+              <h3>2026-05-20 · 转换层改为提示词确认后生成</h3>
+              <span class="tag violet">UI</span>
+              <span class="tag cyan">Workflow</span>
+            </header>
+            <div class="body">
+              <p><strong>问题：</strong>用户希望转换层只做清晰的“上传图/选图 → 分析图 → 对话确认需求 → 弹出出图提示词 → 用户确认 → 生成多角度统一套图”闭环，不能拖入参考后自动开跑，也不能继续保留旧四投放区。</p>
+              <p><strong>改动：</strong><code>SourceSubjectPipeline</code> 恢复轻量对话式转换层：参考帧池缩略图新增 <code>+</code> 操作送入转换层；转换层内可选 GPT/Gemini 套件、分析 1-3 张参考图、查看特征 chips、通过对话生成英文 prompt。<code>subject-agent/message</code> 返回后只打开提示词确认弹窗，不直接生图；用户点“确定生成”才调用 <code>generateSubjectAssets</code>。</p>
+              <p><strong>影响：</strong>右侧主体元素输出、套图文件夹、逐张回填、单张重生和删除逻辑不变。生成数量、方向和风格继续由对话解析，最终英文 prompt 会在确认弹窗中可见。</p>
+            </div>
+          </article>
           <article class="change">
             <header>
               <h3>2026-05-20 · 转换层设计清空待重构</h3>
diff --git a/web/components/ad-recreation-board.tsx b/web/components/ad-recreation-board.tsx
index 2bc7fa9..72a4f1a 100644
--- a/web/components/ad-recreation-board.tsx
+++ b/web/components/ad-recreation-board.tsx
@@ -3315,8 +3315,10 @@ function SourceSubjectPipeline({
   const [agentMode, setAgentMode] = useState<SubjectReconstructionMode>(() => job.subject_agent?.selected_mode ?? "custom")
   const [agentQuantity, setAgentQuantity] = useState(() => job.subject_agent?.quantity ?? 6)
   const [agentRequirement, setAgentRequirement] = useState(() => job.subject_agent?.requirements_zh ?? "")
+  const [agentPrompt, setAgentPrompt] = useState(() => job.subject_agent?.generation_prompt_en ?? "")
   const [agentInput, setAgentInput] = useState("")
   const [subjectAgentBusy, setSubjectAgentBusy] = useState<"analyze" | "message" | null>(null)
+  const [promptConfirmOpen, setPromptConfirmOpen] = useState(false)
   const [promptMemoryByMode, setPromptMemoryByMode] = useState<Record<SubjectReconstructionMode, string[]>>(() => loadSubjectPromptMemory(job.id))
   const [cartoonStyle] = useState<CartoonReconstructionStyle>("3d_animation")
   const [subjectBusyFor, setSubjectBusyFor] = useState<{ jobId: string; jobLabel: string; mode: SubjectReconstructionMode; viewCount: number; sourceCount: number; profileLabel: string; modelLabel: string } | null>(null)
@@ -3412,8 +3414,10 @@ function SourceSubjectPipeline({
     setAgentMode(job.subject_agent?.selected_mode ?? "custom")
     setAgentQuantity(job.subject_agent?.quantity ?? 6)
     setAgentRequirement(job.subject_agent?.requirements_zh ?? "")
+    setAgentPrompt(job.subject_agent?.generation_prompt_en ?? "")
     setAgentInput("")
     setSubjectAgentBusy(null)
+    setPromptConfirmOpen(false)
     setPromptMemoryByMode(loadSubjectPromptMemory(job.id))
     setLastSubjectProfile(null)
     setSubjectBusyFor(null)
@@ -3428,6 +3432,7 @@ function SourceSubjectPipeline({
     setAgentMode(agent?.selected_mode ?? "custom")
     setAgentQuantity(agent?.quantity ?? 6)
     setAgentRequirement(agent?.requirements_zh ?? "")
+    setAgentPrompt(agent?.generation_prompt_en ?? "")
   }, [job.id, job.subject_agent?.updated_at])
 
   useEffect(() => {
@@ -3459,7 +3464,11 @@ function SourceSubjectPipeline({
 
   const subjectModelLabel = (value: SubjectModelBundle) => subjectModelBundleConfig(value).label
 
-  const generateSubjectPack = async (mode: SubjectReconstructionMode, sourceIndices = agentReferenceFrameIndices) => {
+  const generateSubjectPack = async (
+    mode: SubjectReconstructionMode,
+    sourceIndices = agentReferenceFrameIndices,
+    views = selectedSubjectViews,
+  ) => {
     if (subjectBusyFor) {
       toast.warning("主体套图正在生成中，完成后再重生。")
       return
@@ -3492,14 +3501,14 @@ function SourceSubjectPipeline({
       ? null
       : buildSubjectProfileForRequest()
     const subjectStyle = reconstructionSubjectStyle(mode)
-    const userDirection = buildReconstructionDirection(mode, rawDirection, cartoonStyle, selectedSubjectViews.length)
+    const userDirection = buildReconstructionDirection(mode, rawDirection, cartoonStyle, views.length)
     rememberPromptForMode(mode, rawDirection)
     const modeName = reconstructionElementName(mode)
     setSubjectBusyFor({
       jobId: requestJobId,
       jobLabel: shortId(requestJobId),
       mode,
-      viewCount: selectedSubjectViews.length,
+      viewCount: views.length,
       sourceCount: sourceFrames.length,
       profileLabel: requestProfile?.summary ?? "按自主描述",
       modelLabel: subjectModelLabel(subjectModelBundle),
@@ -3529,7 +3538,7 @@ function SourceSubjectPipeline({
         background: "white",
         size: SUBJECT_ASSET_SIZE,
         source_frame_indices: sourceFrames.slice(0, RECONSTRUCTION_FRAME_LIMIT).map((frame) => frame.index),
-        views: selectedSubjectViews,
+        views,
         subject_profile: requestProfile?.payload ?? null,
         prompt: sourceLockedReplication
           ? `${buildSourceLockedSubjectPrompt(subjectStyle)} ${userDirection}`
@@ -3546,7 +3555,7 @@ function SourceSubjectPipeline({
       if (updatedFrame && updatedElement && newestAsset) {
         setExpandedSubjectPackKey(subjectAssetPackKey(updatedFrame, updatedElement, newestAsset))
       }
-      toast.success(`${reconstructionModeConfig(mode).label}已提交：${selectedSubjectViews.length} 张会逐张出来`)
+      toast.success(`${reconstructionModeConfig(mode).label}已提交：${views.length} 张会逐张出来`)
     } catch (e) {
       try {
         onJobUpdate(await getJob(requestJobId))
@@ -3685,7 +3694,16 @@ function SourceSubjectPipeline({
         quantity: agentQuantity,
       })
       onJobUpdate(updated)
+      const nextAgent = updated.subject_agent
+      if (nextAgent) {
+        setAgentMode(nextAgent.selected_mode)
+        setAgentQuantity(nextAgent.quantity)
+        setAgentRequirement(nextAgent.requirements_zh)
+        setAgentPrompt(nextAgent.generation_prompt_en)
+        setAgentReferenceFrameIndices(nextAgent.source_frame_indices)
+      }
       setAgentInput("")
+      setPromptConfirmOpen(true)
     } catch (e) {
       toast.error("生图要求更新失败：" + (e instanceof Error ? e.message : String(e)))
     } finally {
@@ -3714,12 +3732,22 @@ function SourceSubjectPipeline({
   const agentMessages = subjectAgent?.messages ?? []
   const agentTraits = agentAnalysis?.trait_chips ?? []
   const selectedAgentTraits = subjectAgent?.selected_traits ?? []
-  const canGenerateAgentPack = agentMode === "custom"
-    ? Boolean(agentRequirement.trim() || agentReferenceFrames.length)
+  const effectiveAgentMode = subjectAgent?.selected_mode ?? agentMode
+  const effectiveAgentQuantity = subjectAgent?.quantity ?? agentQuantity
+  const effectiveAgentViews = subjectViewsForQuantity(effectiveAgentQuantity)
+  const effectivePrompt = (agentPrompt || subjectAgent?.generation_prompt_en || "").trim()
+  const effectiveRequirement = (subjectAgent?.requirements_zh || agentRequirement).trim()
+  const canGenerateAgentPack = effectiveAgentMode === "custom"
+    ? Boolean(effectiveRequirement || agentReferenceFrames.length)
     : agentReferenceFrames.length > 0
-  const agentModeRunning = runningActorModes.has(agentMode)
+  const agentModeRunning = runningActorModes.has(effectiveAgentMode)
+  const confirmSubjectGeneration = () => {
+    setPromptConfirmOpen(false)
+    void generateSubjectPack(effectiveAgentMode, agentReferenceFrameIndices, effectiveAgentViews)
+  }
 
   return (
+    <>
     <div className="grid gap-2 xl:grid-cols-[150px_minmax(210px,0.75fr)_minmax(0,1.25fr)] 2xl:grid-cols-[170px_minmax(240px,0.8fr)_minmax(0,1.3fr)]">
       <div className="min-w-0">
         <div className="mb-2 flex items-center justify-between gap-2">
@@ -3793,6 +3821,16 @@ function SourceSubjectPipeline({
                     selected={selected}
                     title={selected ? "已选 · 点击取消" : "点击选择"}
                     onClick={() => onToggleFrame(frame.index)}
+                    actions={[
+                      {
+                        key: "send-to-conversion",
+                        label: allConversionFrameIndices.has(frame.index) ? "已在转换层" : "送入转换层",
+                        icon: allConversionFrameIndices.has(frame.index) ? <Check className="h-3 w-3" /> : <Plus className="h-3 w-3" />,
+                        onClick: () => addAgentReferenceFrame(frame),
+                        disabled: allConversionFrameIndices.has(frame.index),
+                        tone: "cyan",
+                      },
+                    ]}
                     topLeft={<span className="rounded bg-black/72 px-1 font-mono text-[9px] text-white/70">{String(index + 1).padStart(2, "0")}</span>}
                     topRight={<span className="rounded-full bg-black/72 p-0.5">{selected ? <Check className="h-3 w-3 text-emerald-200" /> : <Circle className="h-3 w-3 text-white/50" />}</span>}
                     onDelete={onDeleteFrame ? () => onDeleteFrame(frame.index) : undefined}
@@ -3814,9 +3852,171 @@ function SourceSubjectPipeline({
       <div className="min-w-0">
         <div className="mb-2 flex items-center justify-between gap-2">
           <SectionTitle icon={<Wand2 className="h-4 w-4" />} title="转换层" />
+          <span className="rounded-md border border-white/10 bg-black/35 px-2 py-1 text-[10px] text-white/42">
+            {agentReferenceFrames.length ? `${agentReferenceFrames.length}/${RECONSTRUCTION_FRAME_LIMIT} 图` : "待选图"}
+          </span>
         </div>
-        <div className="flex min-h-[410px] items-center justify-center rounded-md border border-dashed border-white/12 bg-black/18 p-4 2xl:min-h-[500px]">
-          <span className="text-[10.5px] text-white/28">转换层待重构</span>
+        <div className="min-h-[410px] rounded-md border border-white/10 bg-black/24 p-2 2xl:min-h-[500px]">
+          <div className="mb-2 grid grid-cols-2 gap-1.5">
+            {SUBJECT_MODEL_BUNDLE_OPTIONS.map((option) => (
+              <button
+                key={option.value}
+                type="button"
+                onClick={() => setSubjectModelBundle(option.value)}
+                className={`rounded-md border px-2 py-1.5 text-left transition ${
+                  subjectModelBundle === option.value
+                    ? "border-cyan-200/65 bg-cyan-300/12 text-cyan-50"
+                    : "border-white/10 bg-black/26 text-white/52 hover:border-white/24 hover:text-white/76"
+                }`}
+                title={option.detail}
+              >
+                <span className="block text-[10px] font-semibold">{option.label}</span>
+                <span className="mt-0.5 block truncate text-[8.5px] opacity-65">{option.detail}</span>
+              </button>
+            ))}
+          </div>
+
+          <div className="rounded-md border border-white/10 bg-black/22 p-2">
+            <div className="mb-1.5 flex items-center justify-between gap-2">
+              <span className="text-[10px] font-semibold text-white/72">参考图</span>
+              <span className="text-[9px] text-white/34">最多 {RECONSTRUCTION_FRAME_LIMIT} 张</span>
+            </div>
+            {agentReferenceFrames.length ? (
+              <div className="grid grid-cols-3 gap-1.5">
+                {agentReferenceFrames.map((frame, index) => (
+                  <MediaAssetTile
+                    key={frame.index}
+                    src={effectiveFrameUrl(job.id, frame)}
+                    alt={`转换参考 ${index + 1}`}
+                    label={`参考 ${index + 1}`}
+                    meta={`${frame.timestamp.toFixed(1)}s`}
+                    className="aspect-[9/16] bg-black"
+                    objectFit="contain"
+                    previewObjectFit="contain"
+                    previewPlacement="left"
+                    previewMaxWidth={300}
+                    topLeft={<span className="rounded bg-black/72 px-1 font-mono text-[9px] text-white/70">{String(index + 1).padStart(2, "0")}</span>}
+                    onDelete={() => removeAgentReferenceFrame(frame.index)}
+                    deleteLabel="移出转换层"
+                  />
+                ))}
+              </div>
+            ) : (
+              <div className="flex h-24 items-center justify-center rounded border border-dashed border-white/12 px-2 text-center text-[10px] leading-snug text-white/32">
+                从左侧参考帧点 + 加入。
+              </div>
+            )}
+            <button
+              type="button"
+              onClick={() => void runSubjectAgentAnalyze()}
+              disabled={!agentReferenceFrames.length || !!subjectAgentBusy}
+              className="skg-secondary-action mt-2 inline-flex h-7 w-full items-center justify-center gap-1.5 px-2 text-[10px] font-semibold transition disabled:cursor-not-allowed disabled:opacity-40"
+            >
+              {subjectAgentBusy === "analyze" ? <Loader2 className="h-3.5 w-3.5 animate-spin" /> : <Sparkles className="h-3.5 w-3.5" />}
+              分析参考图
+            </button>
+          </div>
+
+          {agentAnalysis ? (
+            <div className="mt-2 rounded-md border border-emerald-200/18 bg-emerald-300/[0.055] p-2">
+              <div className="text-[10px] font-semibold text-emerald-50/76">识别结果</div>
+              <p className="mt-1 max-h-16 overflow-auto text-[9.5px] leading-snug text-white/58">{agentAnalysis.summary_zh}</p>
+              {agentTraits.length ? (
+                <div className="mt-2 flex max-h-16 flex-wrap gap-1 overflow-auto">
+                  {agentTraits.slice(0, 12).map((trait) => {
+                    const active = selectedAgentTraits.includes(trait)
+                    return (
+                      <button
+                        key={trait}
+                        type="button"
+                        onClick={() => toggleSubjectAgentTrait(trait)}
+                        className={`rounded-full border px-2 py-0.5 text-[9px] transition ${
+                          active
+                            ? "border-emerald-100/60 bg-emerald-300/15 text-emerald-50"
+                            : "border-white/10 bg-black/26 text-white/46 hover:border-white/22 hover:text-white/70"
+                        }`}
+                      >
+                        {trait}
+                      </button>
+                    )
+                  })}
+                </div>
+              ) : null}
+            </div>
+          ) : null}
+
+          <div className="mt-2 rounded-md border border-white/10 bg-black/22 p-2">
+            <div className="mb-1.5 flex items-center justify-between gap-2">
+              <span className="text-[10px] font-semibold text-white/72">生图对话</span>
+              <span className="text-[9px] text-white/34">
+                {reconstructionModeConfig(effectiveAgentMode).label} · {effectiveAgentQuantity} 张
+              </span>
+            </div>
+            <div className="max-h-28 space-y-1.5 overflow-auto rounded border border-white/8 bg-black/20 p-1.5">
+              {agentMessages.length ? agentMessages.slice(-5).map((message, index) => (
+                <div
+                  key={`${message.created_at}-${index}`}
+                  className={`rounded-md px-2 py-1 text-[9.5px] leading-snug ${
+                    message.role === "user"
+                      ? "ml-5 bg-cyan-300/12 text-cyan-50/74"
+                      : "mr-5 bg-white/[0.055] text-white/58"
+                  }`}
+                >
+                  {message.content}
+                </div>
+              )) : (
+                <div className="flex h-14 items-center justify-center text-center text-[10px] leading-snug text-white/30">
+                  分析后，直接写你要复刻、创新、卡通、数量和画面要求。
+                </div>
+              )}
+            </div>
+            <div className="mt-2 flex flex-wrap gap-1">
+              {["复刻这个人的形象，生成6张", "参考创意但人物不同，生成6张", "卡通风格，生成6张", "人物更大，占画面90%"].map((text) => (
+                <button
+                  key={text}
+                  type="button"
+                  onClick={() => setAgentInput(text)}
+                  className="rounded-full border border-white/10 bg-black/24 px-2 py-0.5 text-[9px] text-white/48 transition hover:border-white/22 hover:text-white/72"
+                >
+                  {text}
+                </button>
+              ))}
+            </div>
+            <textarea
+              value={agentInput}
+              onChange={(event) => setAgentInput(event.target.value)}
+              placeholder="例如：保留透明骨架和蓝色头带，但人物更大，服装统一，生成6张。"
+              className="mt-2 h-20 w-full resize-none rounded-md border border-white/10 bg-black/35 px-2 py-1.5 text-[10.5px] leading-snug text-white outline-none transition placeholder:text-white/24 focus:border-cyan-200/55"
+            />
+            <button
+              type="button"
+              onClick={() => void sendSubjectAgentRequirement()}
+              disabled={!!subjectAgentBusy || (!agentInput.trim() && !agentRequirement.trim())}
+              className="skg-primary-action mt-2 inline-flex h-8 w-full items-center justify-center gap-1.5 px-2 text-[10.5px] font-semibold transition disabled:cursor-not-allowed disabled:opacity-40"
+            >
+              {subjectAgentBusy === "message" ? <Loader2 className="h-3.5 w-3.5 animate-spin" /> : <Send className="h-3.5 w-3.5" />}
+              生成提示词
+            </button>
+          </div>
+
+          {effectivePrompt ? (
+            <div className="mt-2 rounded-md border border-[#d6b36a]/24 bg-[#d6b36a]/[0.075] p-2">
+              <div className="flex items-center justify-between gap-2">
+                <span className="text-[10px] font-semibold text-[#f4dc88]">待确认提示词</span>
+                <span className="text-[9px] text-white/42">{effectiveAgentViews.length} 视图</span>
+              </div>
+              <p className="mt-1 line-clamp-4 text-[9.5px] leading-snug text-white/58">{effectivePrompt}</p>
+              <button
+                type="button"
+                onClick={() => setPromptConfirmOpen(true)}
+                disabled={!canGenerateAgentPack || subjectBusy || agentModeRunning}
+                className="skg-primary-action mt-2 inline-flex h-8 w-full items-center justify-center gap-1.5 px-2 text-[10.5px] font-semibold transition disabled:cursor-not-allowed disabled:opacity-40"
+              >
+                <Check className="h-3.5 w-3.5" />
+                确认并生成 {effectiveAgentViews.length} 张
+              </button>
+            </div>
+          ) : null}
         </div>
       </div>
 
@@ -3928,6 +4128,61 @@ function SourceSubjectPipeline({
         </div>
       </div>
     </div>
+    {promptConfirmOpen && effectivePrompt && typeof document !== "undefined" ? createPortal(
+      <div className="fixed inset-0 z-[10020] flex items-center justify-center bg-black/72 p-4 backdrop-blur-sm">
+        <div className="w-full max-w-2xl rounded-xl border border-white/14 bg-[#11140f] p-4 shadow-[0_28px_90px_rgba(0,0,0,0.72)]">
+          <div className="flex items-start justify-between gap-3">
+            <div>
+              <div className="text-sm font-semibold text-white">确认出图提示词</div>
+              <div className="mt-1 text-[11px] text-white/46">
+                {subjectModelLabel(subjectModelBundle)} · {reconstructionModeConfig(effectiveAgentMode).label} · {effectiveAgentViews.length} 张
+              </div>
+            </div>
+            <button
+              type="button"
+              onClick={() => setPromptConfirmOpen(false)}
+              className="rounded-md border border-white/10 bg-black/30 px-2 py-1 text-[11px] text-white/56 transition hover:border-white/24 hover:text-white"
+            >
+              关闭
+            </button>
+          </div>
+          {effectiveRequirement ? (
+            <div className="mt-3 rounded-md border border-white/10 bg-black/24 px-3 py-2">
+              <div className="text-[10px] font-semibold text-white/54">用户要求</div>
+              <p className="mt-1 text-[11px] leading-relaxed text-white/72">{effectiveRequirement}</p>
+            </div>
+          ) : null}
+          <div className="mt-3 rounded-md border border-[#d6b36a]/24 bg-[#d6b36a]/[0.07] px-3 py-2">
+            <div className="mb-1 text-[10px] font-semibold text-[#f4dc88]">最终英文提示词</div>
+            <textarea
+              readOnly
+              value={effectivePrompt}
+              className="h-44 w-full resize-none rounded-md border border-white/10 bg-black/30 px-2 py-2 font-mono text-[11px] leading-relaxed text-white/76 outline-none"
+            />
+          </div>
+          <div className="mt-4 flex items-center justify-end gap-2">
+            <button
+              type="button"
+              onClick={() => setPromptConfirmOpen(false)}
+              className="skg-secondary-action inline-flex h-9 items-center justify-center px-4 text-[12px] font-semibold"
+            >
+              先不生成
+            </button>
+            <button
+              type="button"
+              onClick={confirmSubjectGeneration}
+              disabled={!canGenerateAgentPack || subjectBusy || agentModeRunning}
+              className="skg-primary-action inline-flex h-9 items-center justify-center gap-1.5 px-4 text-[12px] font-semibold transition disabled:cursor-not-allowed disabled:opacity-40"
+            >
+              <Sparkles className="h-4 w-4" />
+              确定生成 {effectiveAgentViews.length} 张
+            </button>
+          </div>
+        </div>
+      </div>,
+      document.body,
+    ) : null}
+    </>
   )
 }