Files
20260512-skg-tk/.memory/skg-gateway.md

79 lines
3.0 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# SKG AI 网关探测记录
`https://ai.skg.com/ezlink/v1` · OpenAI 兼容 · one-hub 多渠道代理后端
## 端点能力矩阵
| 端点 | 状态 | 用法 | 备注 |
|---|---|---|---|
| `GET /v1/models` | ✅ | 列模型 | 列了 100+ 模型OpenAI/Anthropic/Gemini/DeepSeek 全家桶 + Sora/Whisper/TTS |
| `POST /v1/chat/completions` | ✅ | text/multimodal | image_url 通input_audio 不通 |
| `POST /v1/images/generations` | ✅ | text→image | 支持 `image` 字段做 i2i |
| `POST /v1/images/edits` | ❌ 404 | - | |
| `POST /v1/audio/transcriptions` | ❌ 404 | - | whisper 端点没暴露 |
| `POST /v1/audio/speech` | ❌ 404 | - | tts 端点没暴露 |
| `POST /v1/files` | ❌ 403 | - | "必须指定渠道" |
| `POST /v1/videos/*` | ❌ 404 | - | sora-2 在 models 但端点没通 |
| `POST /v1/responses` | ❌ 400 | - | 不支持 |
| `POST /v1beta/models/{m}:generateContent` | ❌ 404 | - | 原生 Gemini 路径未暴露 |
| `POST /v1/messages` (Anthropic 原生) | ❌ 404 | - | |
## 当前 key 渠道分组
`纯OpenAI+AWSClaude+Gemini官方`
错误 `503 当前分组「纯OpenAI+AWSClaude+Gemini官方」下对于模型 gpt-4o-audio-preview 无可用渠道` 揭示分组规则——audio 渠道未配。
要让 IT 开 audio让他们把 `gpt-4o-audio-preview``whisper-1` 渠道加进这个分组。
## Vision 探测过程
1. **第一次**:用 dog.jpgwiki 200px 缩略图)测,全失败 ❌ → **误判为不通**
2. **第二次**:用 macOS Stone.png 纯灰图测,✅ 通
3. **第三次**:用真关键帧 jpg 测,✅ 完整识别(虽然 content 偶尔空,要从 reasoning_content 挖)
**教训**:网关层探测要用多种格式 / 多张图,单图失败不能下结论。
## image-to-image 探测
- `/v1/images/generations``image: "data:image/jpeg;base64,..."` 字段
- 返回 `data: [{b64_json: ...}]`
- 网关后台 one-hub 内部命名 `one-hub-gemini-image`
- chat completions 同样 multimodal 报 "image upload err" 不通;只走 generations 端点
## 模型实际可用清单
### Vision multimodal识图
- gemini-2.5-flash ⭐ 推荐(速度快,描述好)
- gemini-2.5-pro描述更详细但 thinking 占 token
- claude-sonnet-4-5/4-6
- gpt-4.1, gpt-5/5.1/5.2
### Text chat
- gemini-2.5-flash ⭐ 默认
- gemini-2.5-pro
- 所有 Claude / GPT 模型
### Image generation
- **gemini-3-pro-image-preview** ⭐ = nano-banana-pro推荐
- gemini-3.1-flash-image-preview
- gemini-2.5-flash-image
- gpt-image-1 → 404看起来网关没接通
### Audio
- whisper-1 列了但端点 404
- gpt-4o-transcribe 列了但端点 404
- tts-1 列了但端点 404
- 全部需要 IT 开
### Video
- sora-2 列了但端点 404
- 需要 IT 开 / 外部 key
## prompt 拼合标准(生图)
```
{base scene description}.
Include: {positive elements, separated by comma}.
Do NOT include: {negative elements}.
Output must be clean without any watermark, username text, or platform logo.
```
经过测试 nano-banana-pro 对 "Do NOT include" 响应不错(生成图明显避开列出的元素)。