上下文窗口演进
从 512 tokens 到 1000 万 tokens,AI 的"工作记忆"扩大了近 20,000 倍。
OpenAI GPT 系列
| 模型 |
发布时间 |
上下文窗口 |
备注 |
| GPT-1 |
2018.06 |
512 tokens |
最初的 Transformer LM |
| GPT-2 |
2019.02 |
1,024 tokens |
1.5B 参数 |
| GPT-3 |
2020.05 |
2,048 tokens |
175B 参数,few-shot 涌现 |
| GPT-3.5 / ChatGPT |
2022.11.30 |
4,096 tokens |
聊天界面上线,AI 出圈 |
| GPT-4 |
2023.03.14 |
8K / 32K tokens |
多模态,两个上下文版本 |
| GPT-4 Turbo |
2023.11.06 |
128K tokens |
DevDay 发布,上下文翻 4 倍 |
| GPT-4o |
2024.05.13 |
128K tokens |
全模态,速度更快 |
| o1-preview |
2024.09.12 |
128K tokens |
思维链推理 |
| o1 (正式版) |
2024.12.05 |
200K tokens |
100K 输出 tokens |
| GPT-4.1 |
2025.04.14 |
1M tokens |
含 mini 和 nano 变体 |
| o3 |
2025.04 |
200K tokens |
与 o4-mini 同期发布 |
Anthropic Claude 系列
| 模型 |
发布时间 |
上下文窗口 |
备注 |
| Claude 1 |
2023.03 |
9K tokens |
首次 API 发布 |
| Claude 2 |
2023.07.11 |
100K tokens |
从 9K 跳到 100K,里程碑 |
| Claude 2.1 |
2023.11.21 |
200K tokens |
翻倍 |
| Claude 3 (Haiku/Sonnet/Opus) |
2024.03.04 |
200K tokens |
三级模型家族 |
| Claude 3.5 Sonnet |
2024.06.20 |
200K tokens |
性能超 Opus,性价比之王 |
| Claude 3.5 Sonnet v2 |
2024.10.22 |
200K tokens |
Computer Use 引入 |
| Claude 3.7 Sonnet |
2025.02.25 |
200K tokens |
Extended Thinking 模式 |
| Claude Sonnet 4 / Opus 4 |
2025.05.22 |
200K tokens |
Opus 4 最强编程模型 |
| Claude Sonnet 4.5 |
2025.09.29 |
200K (1M beta) |
1M 上下文 Beta 测试 |
| Claude Opus 4.5 |
2025.11.24 |
200K tokens |
最强推理 |
| Claude Opus 4.6 |
2026.02.05 |
1M tokens |
1M GA,128K 输出 |
| Claude Sonnet 4.6 |
2026.02.17 |
1M tokens |
1M GA,64K 输出 |
Google Gemini 系列
| 模型 |
发布时间 |
上下文窗口 |
备注 |
| Gemini 1.0 |
2023.12.06 |
32K tokens |
Ultra/Pro/Nano 三版 |
| Gemini 1.5 Pro |
2024.02.15 |
1M tokens (默认 128K) |
首个 1M 上下文模型 |
| Gemini 1.5 Pro (扩展) |
2024 年中 |
2M tokens |
Google I/O 翻倍 |
| Gemini 2.0 Flash |
2024.12 |
1M tokens |
Agentic 时代开启 |
| Gemini 2.5 Pro |
2025 |
1M tokens |
— |
| Gemini 2.5 Flash |
2025.05.20 |
1M tokens |
混合思考控制 |
开源模型
Meta Llama
| 模型 |
发布时间 |
上下文窗口 |
| LLaMA 1 |
2023.02.24 |
2,048 tokens |
| Llama 2 |
2023.07 |
4,096 tokens |
| Llama 3 |
2024.04.18 |
8,192 tokens |
| Llama 3.1 |
2024.07.23 |
128K tokens |
| Llama 3.2 |
2024.09 |
128K tokens |
| Llama 4 Maverick |
2025.04.05 |
1M tokens |
| Llama 4 Scout |
2025.04.05 |
10M tokens |
Mistral AI
| 模型 |
发布时间 |
上下文窗口 |
| Mistral 7B |
2023.10 |
8K (滑动窗口到 32K) |
| Mixtral 8x7B |
2023.12.11 |
32K tokens |
| Mistral Large 2 |
2024 |
128K tokens |
| Mistral Small 3.1 |
2025.03.17 |
128K tokens |
阿里 Qwen(通义千问)
| 模型 |
发布时间 |
上下文窗口 |
| Qwen 1 |
2023.08 |
8K tokens |
| Qwen 2 |
2024.06.06 |
128K tokens |
| Qwen 2.5 |
2024.09.19 |
128K tokens |
| Qwen 2.5-1M |
2025.01 |
1M tokens |
| Qwen 3 |
2025.04.28 |
1M tokens |
DeepSeek
| 模型 |
发布时间 |
上下文窗口 |
| DeepSeek-V2 |
2024.05 |
128K tokens |
| DeepSeek-V3 |
2024.12.25 |
128K tokens |
| DeepSeek-R1 |
2025.01.20 |
128K tokens |
增长趋势图
关键转折点
- Claude 2(2023.07) —— 首次突破 100K,证明长上下文可行
- Gemini 1.5 Pro(2024.02) —— 首个 1M 上下文,开启百万 token 时代
- Llama 3.1(2024.07) —— 开源阵营跟进到 128K
- Claude 4.6 / GPT-4.1(2026.02 / 2025.04) —— 主流商用模型进入 1M 时代
- Llama 4 Scout(2025.04) —— 10M tokens,开源模型超越闭源上下文长度