OpenAI 推出 GPT-5.4：号称最强 AI 工作模型，支持 1M Context 与电脑作

麦克哥 • 2026年3月6日 12:58 • Mac教学

GPT-5.3-Codex 和 GPT-5.3 Instant 陆续登场之后，原本以为 GPT-5.3 应该也要来了，没想到这次 OpenAI 跳过，直接带来更大规模升级的「GPT-5.4」，从电脑自主控能力，到上下文窗口突破百万 Token，再到大幅降低幻觉错误率，可说是 GPT-5 系列目前最全面升级的一次。 ChatGPT 订阅用户现在就能使用到。

OpenAI 推出 GPT-5.4：号称最强 AI 工作模型，支持 1M Context 与电脑作 - 麦克哥

GPT-5.4 系列正式亮相，共有两个版本

GPT-5.4 是 OpenAI 在 GPT-5 系列架构下推出的最新旗舰模型，整合先前 GPT-5.3 Codex 的程序能力，同时大幅强化推理、电脑使用（Computer Use）和知识工作三大面向。有两个版本：

GPT-5.4
GPT-5.4 Pro

在 ChatGPT 中，GPT-5.4 Thinking 就是 GPT-5.4。以下是这次几个值得关注的核心特色。

首先是「原生计算机控制能力」，这是 GPT-5.4 最受瞩目的新功能之一。

过去OpenAI的电脑作能力都需仰赖其他模型，而这次GPT-5.4是OpenAI第一款具备原生电脑使用能力的通用模型，可直接通过截图、鼠标与键盘控制电脑，开发者无需另外整合专用模型。也就是说，开发者可以直接用 GPT-5.4 打造 AI Agent，让它自动浏览网站、作软件、执行多步骤任务，而不再只是「生成文字」而已。

https://youtube.com/watch?v=YICiHiU2GBU%3Ffeature%3Doembed

再来是「百万 Token 超大上下文视窗」，在 API 和 Codex 平台上，GPT-5.4 支持最高 100 万个 Token 的上下文视窗，是 OpenAI 目前开放过最大的容量。这让AIAgent可以在极长的工作流程中，持续追踪前面的每一个步骤，不容易因为忘记先前内容而出错。

不过需注意的是，超过标准 272,000 Token 的部分，会以 2 倍用量计入使用额度/限制，因此规划成本时要特别留意。

除了 Token 变大，OpenAI 还特别强调这次的效率也有显著提升。在 Scale 的 MCP Atlas 评测中，启用 Tool Search（工具搜索）功能后，整体 Token 用量可减少约 47%，同时维持相同的准确度：

图像识别方面，GPT-5.4新增支持「原始画质」的输入模式，可处理最高1024万像素或6000像素长边的高分辨率图像（取较小者）。 OpenAI 表示这在图像定位能力、点击精准度等方面都有明显改善。

此外，ChatGGPT 使用 GPT-5.4 Thinking 时，如果遇到较复杂的问题，模型现在会先说明自己的工作方向，让用户审查，甚至可以中途调整指令。

GPT-5.4 的实测效能：跟上一代、竞争对手比起来如何？

这次 OpenAI 公布了一系列基准测试成绩，与前一代 GPT-5.2 和竞争对手相比，进步幅度都非常显著，下面就取几个比较重要的。

电脑桌面作（OSWorld-Verified），这是测试衡量模型通过截图和键盘鼠标作真实桌面环境的能力：

GPT-5.4：75.0%（新高）
人类表现：72.4%
Claude Opus 4.6：72.7%
GPT-5.2：47.3%

GPT-5.4不只超越了上一代近28个百分点，也是首度超越人类平均表现的模型。

横跨 44 种职业类别的知识工作综合测试（GDPval）：

GPT-5.4：83.0%（新高）
GPT-5.4 Pro：82.0%
GPT-5.2：70.9%
GPT-5.2 Pro：74.1%
Claude Opus 4.6：78%

幻觉错误率部分，与GPT-5.2相比，单一事实主张出错的机率降低33%，含错误的整体响应机率降低18%。

OpenAI 各项测试数据和 Claude Opus 4.6、Gemini 3.1 Pro 差距：

如何使用 GPT-5.4？

目前在 ChatGPT、Codex 和 API 中都已经开放 GPT-5.4 模型。 GPT-5.4 Thinking 会陆续逐步推出给 ChatGPT Plus、Team 和 Pro 付费方案的用户，取代原本的 GPT-5.2 Thinking，GPT-5.2 Thinking 将于 2026 年 6 月 5 日退役。