# 上下文窗口演进 > 从 512 tokens 到 1000 万 tokens,AI 的"工作记忆"扩大了近 20,000 倍。 ## OpenAI GPT 系列 | 模型 | 发布时间 | 上下文窗口 | 备注 | |------|----------|-----------|------| | GPT-1 | 2018.06 | 512 tokens | 最初的 Transformer LM | | GPT-2 | 2019.02 | 1,024 tokens | 1.5B 参数 | | GPT-3 | 2020.05 | 2,048 tokens | 175B 参数,few-shot 涌现 | | GPT-3.5 / ChatGPT | 2022.11.30 | 4,096 tokens | 聊天界面上线,AI 出圈 | | GPT-4 | 2023.03.14 | 8K / 32K tokens | 多模态,两个上下文版本 | | GPT-4 Turbo | 2023.11.06 | 128K tokens | DevDay 发布,上下文翻 4 倍 | | GPT-4o | 2024.05.13 | 128K tokens | 全模态,速度更快 | | o1-preview | 2024.09.12 | 128K tokens | 思维链推理 | | o1 (正式版) | 2024.12.05 | 200K tokens | 100K 输出 tokens | | GPT-4.1 | 2025.04.14 | 1M tokens | 含 mini 和 nano 变体 | | o3 | 2025.04 | 200K tokens | 与 o4-mini 同期发布 | ## Anthropic Claude 系列 | 模型 | 发布时间 | 上下文窗口 | 备注 | |------|----------|-----------|------| | Claude 1 | 2023.03 | 9K tokens | 首次 API 发布 | | Claude 2 | 2023.07.11 | 100K tokens | 从 9K 跳到 100K,里程碑 | | Claude 2.1 | 2023.11.21 | 200K tokens | 翻倍 | | Claude 3 (Haiku/Sonnet/Opus) | 2024.03.04 | 200K tokens | 三级模型家族 | | Claude 3.5 Sonnet | 2024.06.20 | 200K tokens | 性能超 Opus,性价比之王 | | Claude 3.5 Sonnet v2 | 2024.10.22 | 200K tokens | Computer Use 引入 | | Claude 3.7 Sonnet | 2025.02.25 | 200K tokens | Extended Thinking 模式 | | Claude Sonnet 4 / Opus 4 | 2025.05.22 | 200K tokens | Opus 4 最强编程模型 | | Claude Sonnet 4.5 | 2025.09.29 | 200K (1M beta) | 1M 上下文 Beta 测试 | | Claude Opus 4.5 | 2025.11.24 | 200K tokens | 最强推理 | | Claude Opus 4.6 | 2026.02.05 | **1M tokens** | 1M GA,128K 输出 | | Claude Sonnet 4.6 | 2026.02.17 | **1M tokens** | 1M GA,64K 输出 | ## Google Gemini 系列 | 模型 | 发布时间 | 上下文窗口 | 备注 | |------|----------|-----------|------| | Gemini 1.0 | 2023.12.06 | 32K tokens | Ultra/Pro/Nano 三版 | | Gemini 1.5 Pro | 2024.02.15 | **1M tokens** (默认 128K) | 首个 1M 上下文模型 | | Gemini 1.5 Pro (扩展) | 2024 年中 | **2M tokens** | Google I/O 翻倍 | | Gemini 2.0 Flash | 2024.12 | 1M tokens | Agentic 时代开启 | | Gemini 2.5 Pro | 2025 | 1M tokens | — | | Gemini 2.5 Flash | 2025.05.20 | 1M tokens | 混合思考控制 | ## 开源模型 ### Meta Llama | 模型 | 发布时间 | 上下文窗口 | |------|----------|-----------| | LLaMA 1 | 2023.02.24 | 2,048 tokens | | Llama 2 | 2023.07 | 4,096 tokens | | Llama 3 | 2024.04.18 | 8,192 tokens | | Llama 3.1 | 2024.07.23 | 128K tokens | | Llama 3.2 | 2024.09 | 128K tokens | | Llama 4 Maverick | 2025.04.05 | **1M tokens** | | Llama 4 Scout | 2025.04.05 | **10M tokens** | ### Mistral AI | 模型 | 发布时间 | 上下文窗口 | |------|----------|-----------| | Mistral 7B | 2023.10 | 8K (滑动窗口到 32K) | | Mixtral 8x7B | 2023.12.11 | 32K tokens | | Mistral Large 2 | 2024 | 128K tokens | | Mistral Small 3.1 | 2025.03.17 | 128K tokens | ### 阿里 Qwen(通义千问) | 模型 | 发布时间 | 上下文窗口 | |------|----------|-----------| | Qwen 1 | 2023.08 | 8K tokens | | Qwen 2 | 2024.06.06 | 128K tokens | | Qwen 2.5 | 2024.09.19 | 128K tokens | | Qwen 2.5-1M | 2025.01 | **1M tokens** | | Qwen 3 | 2025.04.28 | 1M tokens | ### DeepSeek | 模型 | 发布时间 | 上下文窗口 | |------|----------|-----------| | DeepSeek-V2 | 2024.05 | 128K tokens | | DeepSeek-V3 | 2024.12.25 | 128K tokens | | DeepSeek-R1 | 2025.01.20 | 128K tokens | ## 增长趋势图 ``` tokens 10M ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ★ Llama 4 Scout │ 1M ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ★─────────────★ Claude 4.6 / GPT-4.1 │ │ Gemini 1.5 │ │ 200K ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ★───────┤ Claude 2.1 → 3.x 128K ─ ─ ─ ─ ─ ─ ─ ─ ─ ★─┤ │ GPT-4 Turbo / Llama 3.1 │ │ │ │ 100K ─ ─ ─ ─ ─ ─ ─ ★───┤ │ │ Claude 2 32K ─ ─ ─ ─ ─ ─ ★─┤ │ │ │ GPT-4 32K 8K ─ ─ ─ ─ ─ ★─┤ │ │ │ │ GPT-4 4K ─ ─ ─ ─ ★─┤ │ │ │ │ │ ChatGPT 2K ─ ─ ─ ★─┤ │ │ │ │ │ │ GPT-3 1K ─ ─ ★─┤ │ │ │ │ │ │ │ GPT-2 512 ─ ★─┤ │ │ │ │ │ │ │ │ GPT-1 │ │ │ │ │ │ │ │ │ │ ─────┼──┼──┼──┼──┼──┼──┼───┼─┼───────┼──→ 时间 '18'19'20'22'23 '24 '25-26 ``` ## 关键转折点 1. **Claude 2(2023.07)** —— 首次突破 100K,证明长上下文可行 2. **Gemini 1.5 Pro(2024.02)** —— 首个 1M 上下文,开启百万 token 时代 3. **Llama 3.1(2024.07)** —— 开源阵营跟进到 128K 4. **Claude 4.6 / GPT-4.1(2026.02 / 2025.04)** —— 主流商用模型进入 1M 时代 5. **Llama 4 Scout(2025.04)** —— 10M tokens,开源模型超越闭源上下文长度