OpenAI 于 6 月 27 日正式推出了其最新的 GPT-5.6 系列模型。根据美国政府的要求,目前该系列模型仅向少数“可信合作伙伴”提供预览访问。
该系列共包含三个版本的模型:
- Sol:旗舰版本,每 100 万个输入 Tokens 的费用为 5 美元(约合人民币 34 元),每 100 万个输出 Tokens 的费用为 30 美元(约合人民币 204.3 元)。
- Terra:均衡版本,每 100 万个输入 Tokens 的费用为 2.5 美元(约合人民币 17 元),每 100 万个输出 Tokens 的费用为 15 美元(约合人民币 102.1 元)。
- Luna:注重速度和成本效益的版本,每 100 万个输入 Tokens 的费用为 1 美元(约合人民币 6.8 元),每 100 万个输出 Tokens 的费用为 6 美元(约合人民币 40.9 元)。
OpenAI 还提到,他们优化了提示词缓存机制,这使得在调用过程中遇到重复提示词时,成本将更低且更可预测。
在性能表现上,OpenAI 声称 GPT-5.6 Sol 是其迄今为止最强大的模型。该模型引入了新的 Max 推理强度,并通过子智能体加速复杂任务的 Ultra 模式。
在编程能力方面,GPT-5.6 Sol 在 Terminal-Bench 2.1 测试中取得了新的最佳成绩。在标准模式下,其得分达到了 88.8%,超过了 Claude Mythos 5 的 88.0%。当启用 Ultra 模式后,得分更是攀升至 91.9%。
在生物学领域的 GeneBench v1 测试中,GPT-5.6 Sol 在消耗更少 token 的情况下,性能表现优于 GPT-5.5。
网络安全方面,GPT-5.6 Sol 在漏洞研究和利用等需要长链推理的安全任务上展现出显著提升。在 ExploitBench 测试中,该模型仅用约三分之一的输出 token 即可达到与 Mythos Preview 相似的效果。
OpenAI 在安全设计方面表示,GPT-5.6 Sol、Terra 和 Luna 采用了分层防护系统,包括模型内置的拒答机制、生成过程中的实时分类器、账户级别的风险审查、差异化访问控制、监控以及执法机制。对于高风险场景,系统可以暂停生成过程,并由更强大的推理模型进行复核。若内容被判定为违规,将在展示前被拦截。
关于上线计划,OpenAI 计划在未来几周内正式向公众开放 GPT-5.6 Sol、Terra 和 Luna。
此外,OpenAI 还计划于 7 月份在 Cerebras 平台上推出 GPT-5.6 Sol,该版本最高可达每秒 750 token 的处理速度,初期将仅对部分客户开放。





发表您的评论