diff --git a/.memory/worklog.json b/.memory/worklog.json
index 134f41d..368dacb 100644
--- a/.memory/worklog.json
+++ b/.memory/worklog.json
@@ -1,12 +1,5 @@
{
"entries": [
- {
- "files_changed": 1,
- "hash": "7bf9e0f",
- "message": "auto-save 2026-05-15 11:40 (~1)",
- "ts": "2026-05-15T11:40:31+08:00",
- "type": "commit"
- },
{
"files_changed": 2,
"message": "Codex 会话活跃 · 最近命令:codex · 2 项未提交变更 · 最近提交:auto-save 2026-05-15 11:40 (~1)",
@@ -3264,6 +3257,13 @@
"type": "session-heartbeat",
"message": "Codex 会话活跃 · 最近命令:codex · 分支 main · 1 项未提交变更 · 最近提交:fix: tolerate product view model output",
"files_changed": 1
+ },
+ {
+ "ts": "2026-05-17T19:32:19+08:00",
+ "type": "commit",
+ "message": "auto-save 2026-05-17 19:32 (~4)",
+ "hash": "96c998c",
+ "files_changed": 4
}
]
}
diff --git a/api/main.py b/api/main.py
index 1ae7603..2e8aea2 100644
--- a/api/main.py
+++ b/api/main.py
@@ -4380,7 +4380,7 @@ def analyze_product_view(ref_path: Path, index: int) -> dict:
return fallback_product_view(index)
img_b64 = base64.b64encode(ref_path.read_bytes()).decode("ascii")
prompt = (
- "You are inspecting a product reference image for a SKG neck-and-shoulder wearable massage device. The background may be white, black, or simple studio color. "
+ "You are inspecting one reference image from a same-product image pool for a SKG neck-and-shoulder wearable massage device. Do not classify product identity or compare different products; all uploaded references belong to the same product. The background may be white, black, or simple studio color. "
"Classify the camera/view angle into exactly one enum: front, left_45, right_45, side_thickness, inner_contacts, back_bottom. "
"Classify background into exactly one enum: white, black, simple, complex, unknown. Do not request or perform background conversion. "
"Add use_tags from this enum only: hero_packshot, wearing_scale, inner_contact, side_thickness, asymmetry, button_detail, back_bottom, material_texture. "
diff --git a/docs/source-analysis.html b/docs/source-analysis.html
index 3949732..635147b 100644
--- a/docs/source-analysis.html
+++ b/docs/source-analysis.html
@@ -589,7 +589,7 @@
web/next.config.mjs | Next.js 构建配置:静态导出、图片不走优化、禁用开发环境左下角 Next Dev Indicator,并移除 Next 16 已不支持的 eslint 顶层配置,避免本地 dev 出现配置 Issue 提示。 |
web/app/globals.css | 全局主题变量、登录页视觉样式、ReactFlow 样式引用,以及本地开发态 nextjs-portal 遮挡隐藏规则。 |
web/app/page.tsx | 产品工作台主状态:jobs、activeJobId、生成任务状态;主渲染为全屏素材输入列 + 信息流广告复刻工作表;“开始”编排状态只负责在下载完成后自动触发 triggerTranscribe,不再默认触发抽帧、Vision 扫描或分镜初稿保存;底部吸附音频条不再从主界面渲染。 |
- web/components/ad-recreation-board.tsx | 信息流广告复刻工作表:左侧素材输入;右侧展示视频下载状态、默认折叠的音频文案依据,以及统一的音频解析结果面板;面板顶部是一行讲话人/节奏/背景音摘要,下方左侧为原视频播放器、右侧为逐句时间轴,底部横向音频波形用参考图式的连续灰色包络显示响度、停顿和密集爆点。视频播放时通过 requestAnimationFrame 平滑驱动波形播放线,同时同步高亮并滚动当前句;点击音频波形或字幕行会跳转原视频时间。音频结果下方是信息流复刻分镜工作台:顶部产品参考区是不限量产品素材池,可持续上传产品白底图;上传后自动识别正面/左右 45 度/厚度/内侧触点/背底等视角并自动补齐缺失角度,用户只检查视角备注,鼠标悬停可放大预览;补图失败时保留单个缺失视角的重试入口。每条音频分镜纵向排列,行内从左到右串起原内容、新口播文案、画面规划/产品融入、参考帧/关键元素和 6 个候选视频槽。单条生成会从产品素材池自动挑选最多 6 张相关产品图和备注保存为对应关键帧分镜,不会把全部产品图提交给生视频模型,然后复用现有生视频接口提交 Seedance 候选。旧分镜卡、抽帧控制和视频生成组件仍保留在文件里,但当前主路径不渲染。 |
+ web/components/ad-recreation-board.tsx | 信息流广告复刻工作表:左侧素材输入;右侧展示视频下载状态、默认折叠的音频文案依据,以及统一的音频解析结果面板;面板顶部是一行讲话人/节奏/背景音摘要,下方左侧为原视频播放器、右侧为逐句时间轴,底部横向音频波形用参考图式的连续灰色包络显示响度、停顿和密集爆点。视频播放时通过 requestAnimationFrame 平滑驱动波形播放线,同时同步高亮并滚动当前句;点击音频波形或字幕行会跳转原视频时间。音频结果下方是信息流复刻分镜工作台:顶部产品参考区是“同一产品素材池”,不限量上传产品图,不做不同产品身份判断;上传后自动识别正面/左右 45 度/厚度/内侧触点/背底等视角,并标注背景类型、用途标签、生成风险和备注,用户只检查备注,鼠标悬停可放大预览;缺视角补图失败时保留重试入口。每条音频分镜纵向排列,行内从左到右串起原内容、新口播文案、画面规划/产品融入、参考帧/关键元素和 6 个候选视频槽。单条生成会从产品素材池按分镜角色、视角优先级、用途标签、置信度和风险自动挑选最多 6 张相关产品图,不会把全部产品图提交给生视频模型,然后复用现有生视频接口提交 Seedance 候选。旧分镜卡、抽帧控制和视频生成组件仍保留在文件里,但当前主路径不渲染。 |
web/app/login/page.tsx | 生产登录页:访问账号/访问密钥表单、保持登录、错误/成功状态;当前只在原版 Digital Oasis 动态背景上叠加一个组合登录框,桌面端左侧是动态角色,右侧是图标化登录表单;面板左上角展示官网 SKG 字标和中文“营销内容工作台”系统标识。 |
web/app/login/layout.tsx | 登录路由专属 layout:覆盖全站默认网页标题和描述为空,避免 /login 继承工作台 metadata 后在页面源码里继续出现登录界面文字以外的文案。 |
web/components/login/oasis-canvas.tsx | 登录页全屏动态视觉层:用 iframe 直接承载下载包 web/public/oasis-source/index.html 的原 WebGPU / Three.js 草场源码;父级登录页只覆盖自己的文案和表单,并在捕获阶段把全局鼠标坐标同时用原生事件和 postMessage 转发给 iframe,避免登录面板或输入框遮挡时草地失去鼠标响应。 |
@@ -627,7 +627,7 @@ web/app/page.tsx
-> 信息流广告复刻工作表:web/components/ad-recreation-board.tsx
-> 开始:创建/激活 job → 下载完成后自动触发音频处理
-> 左侧素材输入列 + 右侧默认折叠的音频文案依据 + 统一音频解析结果面板(声音摘要在上,原视频与逐句时间轴并排,底部连续响度波形联动)
- -> 信息流复刻分镜工作台:产品白底图素材池不限量上传 → 自动识别视角 → 自动补齐缺失角度 → 人工检查备注 → 单条生成自动挑选最多 6 张相关产品图 → 逐句时间轴 → 原内容 / 新口播文案 / 画面规划与产品融入 / 参考帧与关键元素 / 6 个候选视频槽
+ -> 信息流复刻分镜工作台:同一产品素材池不限量上传 → 自动识别视角 / 背景 / 用途 / 风险 → 人工检查备注 → 单条生成自动挑选最多 6 张相关产品图 → 逐句时间轴 → 原内容 / 新口播文案 / 画面规划与产品融入 / 参考帧与关键元素 / 6 个候选视频槽
-> 底部音频条:不再渲染,音频结果集中到右侧工作表
-> 旧节点/深度素材面板:web/components/nodes/index.tsx、web/components/lightbox.tsx、web/components/storyboard-workbench.tsx(底层保留,当前不作为主入口)
-> API 契约:web/lib/api.ts
@@ -839,7 +839,7 @@ SubjectAsset {
| 首尾帧资产 | POST /frames/{idx}/scene-asset | generateSceneAsset | 同一接口兼容旧场景图和新首尾帧;新流程传 asset_role=first_frame/last_frame,后端走文字生图,参考帧只用于理解透明骨架人形象、比例、机位和光线,生成结果仍保存在 scene_assets 并自动填入产品融合镜头。 |
| 产品图库 | GET /product-library/skg | listProductLibrary | 读取内置 SKG 白底图库 manifest,返回产品标题、品类、尺寸、白底评分和预览图 URL。 |
| 产品图入库到 job | POST /jobs/{id}/assets/product-library | copyProductLibraryAsset | 把一个内置产品图库条目复制为当前 job 的普通 asset,返回 ImageRef(kind="asset"),用于画面工作台产品融合和分镜产品参考组。 |
- | 产品视角识别 | POST /jobs/{id}/assets/product-views/analyze | analyzeProductViews | 读取已上传的产品白底图素材池,不限制只看前 6 张;自动分类为正面、左右 45 度、侧面厚度、内侧触点或背面/底部,并返回中文视角备注和置信度;前端不再要求用户手动选择视角。 |
+ | 产品视角识别 | POST /jobs/{id}/assets/product-views/analyze | analyzeProductViews | 读取同一产品素材池,不限制只看前 6 张;自动分类为正面、左右 45 度、侧面厚度、内侧触点或背面/底部,并返回背景类型、用途标签、中文视角备注、生成风险和置信度;前端不再要求用户手动选择视角,也不做不同产品身份判断。 |
| 产品缺角度补图 | POST /jobs/{id}/assets/product-angle | generateProductAngleAsset | 用当前产品白底图作为参考,通过图像模型自动补全缺失视角,输出新的 ImageRef(kind="asset")。Prompt 会约束白底产品图、左右非对称、厚度、内侧触点和肩颈真实佩戴比例;前端只在自动补图失败时暴露重试入口。 |
| 角色库 | GET /character-library/skg | listCharacterLibrary | 读取内置 5 个透明骨架人角色 manifest,每个角色含正面、左右 45 度、侧面、背面、半身近景和背部特写 7 张参考图。 |
| 角色图入库到 job | POST /jobs/{id}/assets/character-library | copyCharacterLibraryAssets | 把所选角色的 7 张参考图复制为当前 job asset,返回 subject_images,产品融合生成视频时作为人物身份参考图提交。 |
@@ -950,6 +950,19 @@ SubjectAsset {
变更记录
这个记录不是 git log 的替代品。它记录“产品理解发生了什么变化、影响了哪些源码、你以后描述需求时该怎么说”。后续每次改功能都要补一条。
+
+
+ 2026-05-17 · 同一产品素材池增加生视频选图标注
+ UI
+ Workflow
+ API
+
+
+
问题:产品图识别不能只知道“正面/侧面”,下一步生视频需要知道哪些图适合作为主外观、佩戴比例、触点、厚度、按键或材质参考;同时用户已确认上传图属于同一产品,不需要做不同产品身份识别。
+
改动:POST /jobs/{id}/assets/product-views/analyze 扩展返回 background、use_tags、risk。前端 ProductReferenceCard 展示背景、用途标签和风险标记;selectProductItemsForRow 从单纯按视角轮转改为按分镜角色、视角优先级、用途标签、置信度和风险评分,自动挑选最多 6 张产品参考图。
+
影响:api/main.py、web/lib/api.ts、web/components/ad-recreation-board.tsx、docs/source-analysis.html。后续接入图库时,图库只负责确定同一产品身份;这里继续负责该产品多图的角度、背景、用途和生视频风险标注。
+
+
2026-05-17 · 产品视角识别容错解析
diff --git a/web/components/ad-recreation-board.tsx b/web/components/ad-recreation-board.tsx
index d265426..5f0c8f7 100644
--- a/web/components/ad-recreation-board.tsx
+++ b/web/components/ad-recreation-board.tsx
@@ -413,17 +413,45 @@ function productReferenceNotes(items: ProductRefItem[]) {
.join(";")
}
-function selectProductItemsForRow(row: AudioStoryboardRow, items: ProductRefItem[]) {
- if (!items.length) return []
- const priorityByRole: Record = {
+function productPriorityForRow(row: AudioStoryboardRow) {
+ const viewPriorityByRole: Record = {
"开场钩子": ["front", "left_45", "right_45", "side_thickness"],
"痛点推进": ["front", "side_thickness", "left_45", "right_45"],
- "利益证明": ["front", "inner_contacts", "side_thickness", "left_45", "right_45", "back_bottom"],
+ "利益证明": ["inner_contacts", "side_thickness", "front", "left_45", "right_45", "back_bottom"],
"方案过渡": ["front", "left_45", "right_45", "inner_contacts", "side_thickness"],
- "转化收口": ["front", "left_45", "right_45", "back_bottom", "inner_contacts"],
+ "转化收口": ["front", "back_bottom", "left_45", "right_45", "inner_contacts"],
"节奏承接": ["front", "left_45", "right_45", "side_thickness"],
}
- const priority = priorityByRole[row.role] ?? priorityByRole["节奏承接"]
+ const tagPriorityByRole: Record = {
+ "开场钩子": ["hero_packshot", "asymmetry", "side_thickness"],
+ "痛点推进": ["wearing_scale", "side_thickness", "hero_packshot"],
+ "利益证明": ["inner_contact", "wearing_scale", "button_detail", "side_thickness"],
+ "方案过渡": ["wearing_scale", "hero_packshot", "inner_contact"],
+ "转化收口": ["hero_packshot", "back_bottom", "asymmetry", "material_texture"],
+ "节奏承接": ["hero_packshot", "asymmetry", "side_thickness"],
+ }
+ return {
+ views: viewPriorityByRole[row.role] ?? viewPriorityByRole["节奏承接"],
+ tags: tagPriorityByRole[row.role] ?? tagPriorityByRole["节奏承接"],
+ }
+}
+
+function scoreProductItemForRow(row: AudioStoryboardRow, item: ProductRefItem, index: number) {
+ const priority = productPriorityForRow(row)
+ const viewRank = priority.views.indexOf(item.view)
+ const tagScore = item.useTags.reduce((sum, tag) => {
+ const rank = priority.tags.indexOf(tag)
+ return sum + (rank >= 0 ? 18 - rank * 3 : 0)
+ }, 0)
+ const backgroundScore = item.background === "complex" ? -8 : item.background === "unknown" ? -3 : 0
+ const riskScore = item.risk ? -10 : 0
+ const confidenceScore = Math.round((item.confidence ?? 0.5) * 10)
+ const rotationScore = -Math.abs((row.index % Math.max(1, index + 1)) - (index % 3))
+ return (viewRank >= 0 ? 30 - viewRank * 4 : 0) + tagScore + backgroundScore + riskScore + confidenceScore + rotationScore
+}
+
+function selectProductItemsForRow(row: AudioStoryboardRow, items: ProductRefItem[]) {
+ if (!items.length) return []
const picked: ProductRefItem[] = []
const pickedIds = new Set()
const add = (item?: ProductRefItem) => {
@@ -432,13 +460,28 @@ function selectProductItemsForRow(row: AudioStoryboardRow, items: ProductRefItem
pickedIds.add(item.id)
}
- for (const view of priority) {
- const matches = items.filter((item) => item.view === view)
- add(matches[row.index % Math.max(matches.length, 1)])
+ const priority = productPriorityForRow(row)
+ for (const view of priority.views) {
+ const matches = items
+ .map((item, index) => ({ item, score: scoreProductItemForRow(row, item, index) }))
+ .filter(({ item }) => item.view === view)
+ .sort((a, b) => b.score - a.score)
+ add(matches[0]?.item)
}
- for (let i = 0; picked.length < Math.min(MAX_PRODUCT_REFS_PER_VIDEO, items.length) && i < items.length; i += 1) {
- add(items[(row.index + i) % items.length])
+ for (const tag of priority.tags) {
+ const matches = items
+ .map((item, index) => ({ item, score: scoreProductItemForRow(row, item, index) }))
+ .filter(({ item }) => item.useTags.includes(tag))
+ .sort((a, b) => b.score - a.score)
+ add(matches[0]?.item)
+ }
+
+ const ranked = items
+ .map((item, index) => ({ item, score: scoreProductItemForRow(row, item, index) }))
+ .sort((a, b) => b.score - a.score)
+ for (const { item } of ranked) {
+ add(item)
}
return picked
@@ -449,8 +492,8 @@ function buildStoryboardSceneFromAudioRow(row: AudioStoryboardRow, frame: KeyFra
const productRefs = selectedProductItems.map((item) => item.ref)
const notes = productReferenceNotes(selectedProductItems)
const productGuidance = productItems.length
- ? `产品素材池共有 ${productItems.length} 张,本条只选用 ${selectedProductItems.length} 张最相关参考图,不要把未选素材混入本条画面。视角备注:${notes}。保留左右非对称细节,不要把两边做成镜像对称;肩颈产品大小必须贴近真实佩戴比例,不能缩成耳机,也不能放大成护颈枕。`
- : "未上传产品白底图时使用默认 SKG 产品图;生成前建议先建立产品素材池,锁定左右差异、厚度和佩戴比例。"
+ ? `产品素材池共有 ${productItems.length} 张,本条只选用 ${selectedProductItems.length} 张最相关参考图,不要把未选素材混入本条画面。所选图片只作为产品结构、角度、比例和细节参考,不要照搬参考图的白底/黑底/棚拍背景。视角标注:${notes}。保留左右非对称细节,不要把两边做成镜像对称;肩颈产品大小必须贴近真实佩戴比例,不能缩成耳机,也不能放大成护颈枕。`
+ : "未上传产品图时使用默认 SKG 产品图;生成前建议先建立同一产品素材池,锁定左右差异、厚度和佩戴比例。"
return {
duration: Number(Math.max(3.2, Math.min(6.5, row.end - row.start || 4.5)).toFixed(1)),
first_image: { kind: "keyframe", frame_idx: frame.index, label: `分镜 ${row.index + 1} 参考帧` },
@@ -1118,6 +1161,9 @@ function AudioStoryboardPlanPanel({
itemSourceForRef(ref),
validView,
analysis?.note,
+ analysis?.background ?? "unknown",
+ analysis?.use_tags,
+ analysis?.risk ?? "",
analysis?.confidence,
)
})
@@ -1139,7 +1185,7 @@ function AudioStoryboardPlanPanel({
})
working = [
...working,
- createProductRefItem(ref, working.length, "ai", slot.value, `AI 补齐:${slot.hint}`, 1),
+ createProductRefItem(ref, working.length, "ai", slot.value, `AI 补齐:${slot.hint}`, "white", undefined, "", 1),
]
setProductItems(working)
} catch (e) {
@@ -1210,9 +1256,9 @@ function AudioStoryboardPlanPanel({
try {
const refs = await Promise.all(selected.map((file) => uploadStoryboardAsset(job.id, file)))
await analyzeUploadedProductRefs(refs)
- toast.success(`已上传 ${refs.length} 张产品白底图`)
+ toast.success(`已上传 ${refs.length} 张产品图`)
} catch (e) {
- toast.error("产品白底图上传失败:" + (e instanceof Error ? e.message : String(e)))
+ toast.error("产品图上传失败:" + (e instanceof Error ? e.message : String(e)))
} finally {
setProductUploading(false)
}
@@ -1241,7 +1287,7 @@ function AudioStoryboardPlanPanel({
target_view: slot.label,
note: slot.hint,
})
- setProductItems((prev) => [...prev, createProductRefItem(ref, prev.length, "ai", slot.value, `AI 补齐:${slot.hint}`, 1)])
+ setProductItems((prev) => [...prev, createProductRefItem(ref, prev.length, "ai", slot.value, `AI 补齐:${slot.hint}`, "white", undefined, "", 1)])
toast.success(`AI 已补全产品视角:${slot.label}`)
} catch (e) {
toast.error("AI 补角度失败:" + (e instanceof Error ? e.message : String(e)))
@@ -1287,7 +1333,7 @@ function AudioStoryboardPlanPanel({
- } title="产品白底图 / 视角补全" />
+ } title="同一产品素材池 / 视角标注" />
{productItems.length ? `${productItems.length} 张素材` : "素材池不限量"}
{(productAnalyzing || productAngleBusy) && (
@@ -1297,7 +1343,7 @@ function AudioStoryboardPlanPanel({
)}
- 上传后自动识别每张图的角度和视角,并自动补齐缺失角度;产品素材池不限制数量。每条视频生成时只自动挑选最多 {MAX_PRODUCT_REFS_PER_VIDEO} 张相关产品图,避免把所有素材都塞给模型。
+ 上传的图默认属于同一个产品;系统只标注背景、视角、用途和生成风险。每条视频生成时自动挑选最多 {MAX_PRODUCT_REFS_PER_VIDEO} 张相关产品图,避免把所有素材都塞给模型。
@@ -1317,7 +1363,7 @@ function AudioStoryboardPlanPanel({
className="inline-flex h-9 items-center justify-center gap-1 rounded-md border border-white/10 bg-white/[0.055] px-2.5 text-[11px] font-semibold text-white/72 transition hover:border-white/25 hover:bg-white/[0.1] disabled:cursor-not-allowed disabled:opacity-40"
>
{productUploading ?
:
}
- 上传白底图
+ 上传产品图
void
}) {
const src = resolveImageRefUrl(job.id, item.ref)
+ const tagLabels = item.useTags.map((tag) => PRODUCT_USE_TAG_LABELS[tag]).filter(Boolean)
return (

-
{productViewLabel(item.view)} · {item.note}
+
+ {productViewLabel(item.view)} · {productBackgroundLabel(item.background)} · {tagLabels.join(" / ")}
+
+ {item.note}
+ {item.risk ? <>
风险:{item.risk}> : null}
+
{item.source === "ai" ? "AI" : "图"}
@@ -1476,6 +1528,13 @@ function ProductReferenceCard({
{item.source === "ai" ? "自动补图" : item.confidence != null ? `自动识别 ${Math.round(item.confidence * 100)}%` : "自动识别"}
+
+ {productBackgroundLabel(item.background)}
+ {tagLabels.slice(0, 3).map((tag) => (
+ {tag}
+ ))}
+ {item.risk ? 有风险 : null}
+
onPatch({ note: event.target.value })}