OpenAI 推出 GPT-5.4:号称最强 AI 工作模型,支持 1M Context 与电脑作

GPT-5.3-Codex 和 GPT-5.3 Instant 陆续登场之后,原本以为 GPT-5.3 应该也要来了,没想到这次 OpenAI 跳过,直接带来更大规模升级的「GPT-5.4」,从电脑自主控能力,到上下文窗口突破百万 Token, 再到大幅降低幻觉错误率,可说是 GPT-5 系列目前最全面升级的一次。 ChatGPT 订阅用户现在就能使用到。

OpenAI 推出 GPT-5.4:号称最强 AI 工作模型,支持 1M Context 与电脑作 - 麦克哥

GPT-5.4 系列正式亮相,共有两个版本

GPT-5.4 是 OpenAI 在 GPT-5 系列架构下推出的最新旗舰模型,整合先前 GPT-5.3 Codex 的程序能力,同时大幅强化推理、电脑使用(Computer Use)和知识工作三大面向。 有两个版本:

  • GPT-5.4
  • GPT-5.4 Pro

在 ChatGPT 中,GPT-5.4 Thinking 就是 GPT-5.4。 以下是这次几个值得关注的核心特色。

首先是「原生计算机控制能力」,这是 GPT-5.4 最受瞩目的新功能之一。

过去OpenAI的电脑作能力都需仰赖其他模型,而这次GPT-5.4是OpenAI第一款具备原生电脑使用能力的通用模型,可直接通过截图、鼠标与键盘控制电脑,开发者无需另外整合专用模型。 也就是说,开发者可以直接用 GPT-5.4 打造 AI Agent,让它自动浏览网站、作软件、执行多步骤任务,而不再只是「生成文字」而已。

https://youtube.com/watch?v=YICiHiU2GBU%3Ffeature%3Doembed

再来是「百万 Token 超大上下文视窗」,在 API 和 Codex 平台上,GPT-5.4 支持最高 100 万个 Token 的上下文视窗,是 OpenAI 目前开放过最大的容量。 这让AIAgent可以在极长的工作流程中,持续追踪前面的每一个步骤,不容易因为忘记先前内容而出错。

不过需注意的是,超过标准 272,000 Token 的部分,会以 2 倍用量计入使用额度/限制,因此规划成本时要特别留意。

除了 Token 变大,OpenAI 还特别强调这次的效率也有显著提升。 在 Scale 的 MCP Atlas 评测中,启用 Tool Search(工具搜索)功能后,整体 Token 用量可减少约 47%,同时维持相同的准确度:

OpenAI 推出 GPT-5.4:号称最强 AI 工作模型,支持 1M Context 与电脑作 - 麦克哥

图像识别方面,GPT-5.4新增支持「原始画质」的输入模式,可处理最高1024万像素或6000像素长边的高分辨率图像(取较小者)。 OpenAI 表示这在图像定位能力、点击精准度等方面都有明显改善。

此外,ChatGGPT 使用 GPT-5.4 Thinking 时,如果遇到较复杂的问题,模型现在会先说明自己的工作方向,让用户审查,甚至可以中途调整指令。

GPT-5.4 的实测效能:跟上一代、竞争对手比起来如何?

这次 OpenAI 公布了一系列基准测试成绩,与前一代 GPT-5.2 和竞争对手相比,进步幅度都非常显著,下面就取几个比较重要的。

电脑桌面作(OSWorld-Verified),这是测试衡量模型通过截图和键盘鼠标作真实桌面环境的能力:

  • GPT-5.4:75.0%(新高)
  • 人类表现:72.4%
  • Claude Opus 4.6:72.7%
  • GPT-5.2:47.3%

GPT-5.4不只超越了上一代近28个百分点,也是首度超越人类平均表现的模型。

OpenAI 推出 GPT-5.4:号称最强 AI 工作模型,支持 1M Context 与电脑作 - 麦克哥

横跨 44 种职业类别的知识工作综合测试(GDPval):

  • GPT-5.4:83.0%(新高)
  • GPT-5.4 Pro:82.0%
  • GPT-5.2:70.9%
  • GPT-5.2 Pro:74.1%
  • Claude Opus 4.6:78%
OpenAI 推出 GPT-5.4:号称最强 AI 工作模型,支持 1M Context 与电脑作 - 麦克哥

幻觉错误率部分,与GPT-5.2相比,单一事实主张出错的机率降低33%,含错误的整体响应机率降低18%。

OpenAI 各项测试数据和 Claude Opus 4.6、Gemini 3.1 Pro 差距:

OpenAI 推出 GPT-5.4:号称最强 AI 工作模型,支持 1M Context 与电脑作 - 麦克哥

如何使用 GPT-5.4?

目前在 ChatGPT、Codex 和 API 中都已经开放 GPT-5.4 模型。 GPT-5.4 Thinking 会陆续逐步推出给 ChatGPT Plus、Team 和 Pro 付费方案的用户,取代原本的 GPT-5.2 Thinking,GPT-5.2 Thinking 将于 2026 年 6 月 5 日退役。

OpenAI 推出 GPT-5.4:号称最强 AI 工作模型,支持 1M Context 与电脑作 - 麦克哥

除了模型本身,这次 OpenAI 也同步推出几项企业导向的新功能:

  • ChatGPT for Excel 和百度Sheets(测试版):直接嵌入电子表格,能建立和分析复杂的财务模型
  • 新的金融数据整合:包含FactSet、MSCI、Moody’s等金融资料供应商的串接功能
(0)
麦克哥麦克哥

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注