Jan To Apr (10) May To Aug (05) Sep To Dec (07)

OpenAI 最强 AI 模型：GPT-5.6 系列登场，编程跑分超 Claude Mythos 5

OpenAI 于 6 月 27 日正式推出了其最新的 GPT-5.6 系列模型。根据美国政府的要求，目前该系列模型仅向少数“可信合作伙伴”提供预览访问。

该系列共包含三个版本的模型：

Sol：旗舰版本，每 100 万个输入 Tokens 的费用为 5 美元（约合人民币 34 元），每 100 万个输出 Tokens 的费用为 30 美元（约合人民币 204.3 元）。
Terra：均衡版本，每 100 万个输入 Tokens 的费用为 2.5 美元（约合人民币 17 元），每 100 万个输出 Tokens 的费用为 15 美元（约合人民币 102.1 元）。
Luna：注重速度和成本效益的版本，每 100 万个输入 Tokens 的费用为 1 美元（约合人民币 6.8 元），每 100 万个输出 Tokens 的费用为 6 美元（约合人民币 40.9 元）。

OpenAI 还提到，他们优化了提示词缓存机制，这使得在调用过程中遇到重复提示词时，成本将更低且更可预测。

在性能表现上，OpenAI 声称 GPT-5.6 Sol 是其迄今为止最强大的模型。该模型引入了新的 Max 推理强度，并通过子智能体加速复杂任务的 Ultra 模式。

在编程能力方面，GPT-5.6 Sol 在 Terminal-Bench 2.1 测试中取得了新的最佳成绩。在标准模式下，其得分达到了 88.8%，超过了 Claude Mythos 5 的 88.0%。当启用 Ultra 模式后，得分更是攀升至 91.9%。

在生物学领域的 GeneBench v1 测试中，GPT-5.6 Sol 在消耗更少 token 的情况下，性能表现优于 GPT-5.5。

网络安全方面，GPT-5.6 Sol 在漏洞研究和利用等需要长链推理的安全任务上展现出显著提升。在 ExploitBench 测试中，该模型仅用约三分之一的输出 token 即可达到与 Mythos Preview 相似的效果。

OpenAI 在安全设计方面表示，GPT-5.6 Sol、Terra 和 Luna 采用了分层防护系统，包括模型内置的拒答机制、生成过程中的实时分类器、账户级别的风险审查、差异化访问控制、监控以及执法机制。对于高风险场景，系统可以暂停生成过程，并由更强大的推理模型进行复核。若内容被判定为违规，将在展示前被拦截。

关于上线计划，OpenAI 计划在未来几周内正式向公众开放 GPT-5.6 Sol、Terra 和 Luna。

此外，OpenAI 还计划于 7 月份在 Cerebras 平台上推出 GPT-5.6 Sol，该版本最高可达每秒 750 token 的处理速度，初期将仅对部分客户开放。

3 条评论

发表您的评论

游戏资讯精选

玩家故事分享

玩家故事分享

玩家故事分享

玩家故事分享

3 条评论

发表您的评论