chore: force gpt routing for vision and rewrite

This commit is contained in:
2026-05-18 14:34:36 +08:00
parent a2897ef2be
commit 2cfd7de5d5
5 changed files with 22 additions and 9 deletions

View File

@@ -882,7 +882,7 @@ ProductRefStateItem {
</thead>
<tbody>
<tr><td>网页登录</td><td><code>POST /auth/login</code><code>GET /auth/check</code><code>POST /auth/logout</code></td><td><code>web/app/login/page.tsx</code>、Nginx <code>auth_request</code></td><td>登录页提交账号密码到 <code>/api/auth/login</code>,后端设置 HttpOnly 会话 Cookie生产 Nginx 对工作台和 <code>/api/</code><code>/auth/check</code> 做统一校验,未登录页面跳 <code>/login/</code>API 返回 JSON 401。</td></tr>
<tr><td>运行配置 / 模型标注</td><td><code>GET /health</code></td><td><code>getRuntimeHealth</code><code>ModelTrace</code></td><td>返回 <code>models</code>ASR、本机 ASR、ASR fallback、翻译、GPT 改写、GPT 画面理解、产品视角识别 <code>product_view</code>、GPT 图像模型、主体 6 视图 GPT 图像模型、Azure OpenAI TTS、视频别名和 Seedance 服务商。当前 <code>REWRITE_MODEL</code><code>AUDIO_REWRITE_MODEL</code><code>VISION_MODEL</code> 默认使用 <code>gpt-4o</code>。前端所有当前主路径里会调用模型的按钮旁显示模型名,点击弹出小窗口查看模型链路和输入输出逻辑;不返回 API Key 或敏感凭证。</td></tr>
<tr><td>运行配置 / 模型标注</td><td><code>GET /health</code></td><td><code>getRuntimeHealth</code><code>ModelTrace</code></td><td>返回 <code>models</code>ASR、本机 ASR、ASR fallback、翻译、GPT 改写、GPT 画面理解、产品视角识别 <code>product_view</code>、GPT 图像模型、主体 6 视图 GPT 图像模型、Azure OpenAI TTS、视频别名和 Seedance 服务商。当前 <code>REWRITE_MODEL</code><code>AUDIO_REWRITE_MODEL</code><code>VISION_MODEL</code> 默认使用 <code>gpt-4o</code>;如果旧环境变量仍写 <code>gemini-*</code>,后端会归一化回 <code>GPT_TEXT_MODEL</code> / <code>REWRITE_MODEL</code>。前端所有当前主路径里会调用模型的按钮旁显示模型名,点击弹出小窗口查看模型链路和输入输出逻辑;不返回 API Key 或敏感凭证。</td></tr>
<tr><td>历史列表</td><td><code>GET /jobs</code></td><td><code>listJobs</code></td><td>所有 job 精简列表id/url/status/thumbnail/mtime…按 state.json mtime 倒序。前端 URL 无 <code>?job=</code> 时拉它回填全部历史;带 <code>limit</code> 可截断。</td></tr>
<tr><td>创建任务</td><td><code>POST /jobs</code></td><td><code>createJob</code></td><td>提交 TK 链接,后台开始下载;前端“开始”队列会在 downloaded 后自动触发音频解析。</td></tr>
<tr><td>上传视频</td><td><code>POST /jobs/upload</code></td><td><code>uploadJob</code></td><td>保存 source.mp4然后同样进入下载完成状态当前上传后也加入第一步队列下载完成后自动解析音频。</td></tr>
@@ -1024,8 +1024,8 @@ ProductRefStateItem {
</header>
<div class="body">
<p><strong>问题:</strong>关键帧画面理解和分镜/口播改写仍默认走 Gemini 模型,不符合后端模型分工要把这两类能力切到 GPT 的要求。</p>
<p><strong>改动:</strong><code>api/main.py</code> 默认 <code>VISION_MODEL</code><code>REWRITE_MODEL</code><code>AUDIO_REWRITE_MODEL</code> <code>gpt-4o</code><code>api/.env.example</code><code>deploy/.env.production.example</code><code>RULES.md</code> 同步补齐 GPT 默认模型说明。</p>
<p><strong>影响:</strong><code>/health</code><code>models.vision</code><code>models.rewrite</code><code>models.audio_rewrite</code> 会向前端模型标注暴露 GPT 模型名后续描述模型分工时Gemini 仍保留在 ASR fallback / 翻译链路,画面理解和文案改写默认归 GPT。</p>
<p><strong>改动:</strong><code>api/main.py</code> 新增 <code>GPT_TEXT_MODEL</code> / <code>gpt_model_env</code>默认 <code>VISION_MODEL</code><code>REWRITE_MODEL</code><code>AUDIO_REWRITE_MODEL</code><code>gpt-4o</code>如果旧部署环境仍把这些变量写成 <code>gemini-*</code>,后端会自动归一化回 GPT。<code>api/.env.example</code><code>deploy/.env.production.example</code><code>RULES.md</code> 同步补齐 GPT 默认模型说明。</p>
<p><strong>影响:</strong><code>/health</code><code>models.vision</code><code>models.rewrite</code><code>models.audio_rewrite</code> 会向前端模型标注暴露 GPT 模型名后续描述模型分工时Gemini 仍保留在 ASR fallback / 翻译链路,画面理解和文案改写默认归 GPT,并且不会被旧 Gemini 环境变量误覆盖</p>
</div>
</article>
<article class="change">