财联社-深度 昨天
GPT-5.6深夜亮相!性能反超竞品Mythos 但大多数用户暂无缘使用
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

财联社 6 月 27 日讯(编辑 史正丞)北京时间周六凌晨,OpenAI 官宣推出新一代旗舰大模型 GPT ‑ 5.6 系列。但由于美国政府的阻挠,目前只有获得美国政府批准的一小撮 " 受信任合作伙伴 " 能够用上这款代表人类 AI 能力新巅峰的大模型。

据 OpenAI 介绍,GPT ‑ 5.6 系列一共有 3 款模型:旗舰模型 Sol、适合日常工作的均衡型模型 Terra,以及快速且经济的 Luna 模型

用更容易理解的角度来解释,这三个单词也有太阳、地球和月亮的含义。

(来源:OpenAI)

其中,GPT ‑ 5.6 Sol 能够引入更高等级的推理强度,让 AI 有更多时间进行深入推理;同时,OpenAI 还推出利用子智能体加速复杂任务的 GPT ‑ 5.6 Sol Ultra 模式。

OpenAI 声称,在检验编程工作流的 Terminal ‑ Bench 2.1 测试中,GPT ‑ 5.6 Sol 的表现略好于主要竞争对手 Anthropic 的 Mythos 预览模型。同时 Terra 的表现与 Mythos 模型的首个公开发布版本 Fable 5 持平。主打轻量化的 Luna 模型,也能比竞品 Anthropic 目前仍能公开提供服务的旗舰模型 Opus 4.8 强上一些。

(来源:OpenAI)

而在名为 ExploitBench 的网络安全基准测试中,Sol 与 Mythos 预览模型表现相当,但仅使用了三分之一的输出词元(显著省钱)

定价方面,旗舰模型 Sol 的输入 / 输出价格为每百万词元 5 美元 /30 美元;均衡模型 Terra 为 2.5 美元 /15 美元;轻量模型 Luna 为 1 美元 /6 美元。

对于资本市场而言,眼下更大的不确定性在于,GPT ‑ 5.6 和 Mythos/Fable 模型均在美国政府的要求下禁止对广泛公众开放

大约在两周前,Anthropic 上线 Fable 5 仅 3 天便火速下线,原因是收到美国政府出口管制指令,禁止一切外国国民(含 Anthropic 外籍员工)访问 Fable 5 与 Mythos 模型

美国政府也对 GPT-5.6 采取了类似的措施。据报道,OpenAI 掌门山姆 · 奥尔特曼在周四的内部员工备忘录中提及,美国政府将在此次 GPT ‑ 5.6 预览期间 " 逐个批准客户访问申请 "

OpenAI 也在周五的公告中表示,他们不认为 " 这种政府访问审批流程应成为长期默认做法 ",因为它 " 剥夺了需要这些最佳工具的用户、开发者、企业、网络防御者和全球合作伙伴的使用权 "

公司同时表示,目前的 " 短期措施 ",是在未来几周实现更广泛开放的最有力路径。OpenAI 未来将与政府合作,制定网络安全行政令框架,以及可重复执行的模型发布流程。

作为 " 求生欲 " 的象征,OpenAI 公告中半数以上篇幅都在谈论如何保障前沿大模型不被用于网络攻击等恶意行为。

公司表示,GPT-5.6 被训练为会拒绝提供被禁止的网络安全协助。即便这一层防护被恶意行为者通过不断尝试提示词绕过,实时网络安全和生物学滥用分类器也会在模型生成输出的过程中进行评估,并对潜在恶意行为进行拦截。

OpenAI 同时警告称,被标记的活动可能触发对相关对话和风险信号的账户级审查。

公司补充称,GPT ‑ 5.6 模型尚未触及 OpenAI 所界定的 " 关键网络安全风险 " 门槛,该门槛被定义为带来 " 前所未有的通向严重危害的新途径 "。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论