01发布GPT-5.5的同一天,OpenAI挂出2.5万美元征集生物越狱
GPT-5.5今天对所有付费用户开放。同一天,OpenAI在博客挂出一份红队悬赏:找出让模型在生物安全话题上通用失守的越狱路径,最高可拿2.5万美元。页面强调赏金只发给通用型越狱,也就是对整类危险请求都有效的绕过手法,而不是针对某个具体提问的单次绕过。
这是OpenAI第一次把生物风险做成对外悬赏。过去几代旗舰模型走的都是闭门红队路线:签几家第三方安全机构做有限测试,结果写进System Card了事。这次悬赏页面直接对全球研究者开放,任何人提交可复现的通用越狱都能申领。
同步发布的System Card给了这个动作一个解释。文档显示,新模型在生化威胁类别下的能力评估里出现了前几代没有的跃升,部分子项已接近OpenAI自己设定的高风险阈值。按其内部准备度框架,一旦模型越过阈值,就必须启动外部对抗测试——这份悬赏是规则触发后的必然动作。
生物安全漏洞从今天起走上了Web漏洞那种流程:公开征集、按条付钱、面向全球研究者。2.5万美元是这套流程里单条通用越狱的顶格价。
02Anthropic罕见公开Claude Code降质postmortem,同周OpenAI把Codex晒到400万周活
过去几周Claude Code的回答质量持续下滑。Anthropic周三发了一份postmortem,解释了哪些请求命中了问题分支、修复为什么滞后这么久。闭源AI公司公开debug相当罕见,说明投诉已经多到不能再用「未复现」搪塞。
同一周,OpenAI走的是相反方向。它把Codex推进了Accenture、PwC等大型咨询机构,首次公布400万周活用户,并推出面向企业部署的Codex Labs。
一家在向重度用户坦白质量问题、承担信任代价;另一家在把分销面铺向对可靠性要求极高的企业客户。两套不同阶段的产品动作。
Claude Code用户可以对照postmortem标出的时间窗口,排查近期遇到的异常。Codex这边的风险是:未来几个月咨询巨头的交付代码里开始承接其生成部分,一旦出现类似回退,波及的将是企业合同而非个人订阅。
03LLMs+、世界模型、agent编排:MIT把2026年的AI拆成三条主线
MIT Tech Review今年的AI清单不再把LLM当作单一未来主轴。取而代之的是三条并列路线:LLMs+、世界模型、agent编排。三条各自在补LLM的不同短板。
LLMs+往上叠推理、记忆、工具调用这些外挂层;世界模型瞄准LLM不会的物理因果和空间推理,这是让AI叠衣服、过街道的前提;agent编排面对的工程现实是,单个模型再强,多步任务也要靠系统把调度、记忆、工具、状态串起来。
真正的分野在工具链。做LLMs+的关心检索和上下文管理;做世界模型的关心仿真环境和视频数据;做agent的关心任务图和通信协议。从2026年开始,产品团队的第一个决策不再是「选哪个基础模型」,而是「自己属于哪条主线」。
工具链一旦分叉,跨主线的迁移成本会远高于切换LLM。

Meta宣布5月裁员10% Meta首席人事官Janelle Gale在内部备忘录中确认,5月将裁撤约8000名员工,同时关闭约6000个空缺岗位。 theverge.com
微软在Word、Excel、PowerPoint上线Agent Mode 本周开始推送,Office版本的「vibe working」形态,替代此前面向企业的Copilot体验。 theverge.com
谷歌Workspace引入Workspace Intelligence 把一整套自动化功能塞进Docs、Gmail、Sheets,定位为「办公室实习生」。和微软Agent Mode同周亮相。 techcrunch.com
Claude接入Spotify、Uber Eats、TurboTax等个人应用 Anthropic新增一批面向生活场景的connector,包括Audible、AllTrails、TripAdvisor、Instacart等,此前connector主要覆盖办公软件。 theverge.com
Tesla把2026年capex抬到250亿美元 CFO表示开支是历史均值的三倍,公司今年剩余时间自由现金流将转负。 techcrunch.com
MIT Tech Review:中国AI实验室押注开源权重 报道梳理中美路线分歧——硅谷把模型锁在API后按token计费,中国头部实验室把模型作为「开源权重」包发布,让开发者本地部署。 technologyreview.com
DeepMind发布Decoupled DiLoCo 把通信与计算解耦的分布式训练方案,目标是在网络抖动、节点掉线等不稳定条件下仍能跑大规模训练。 deepmind.google
Bret Taylor的Sierra收购YC系Fragment 客服agent公司Sierra把法国YC毕业生Fragment收入囊中,未披露金额。 techcrunch.com
X用Grok重做时间线,Communities被替代 新的AI策划自定义feed全量上线,同时在其中插入新的广告位。 techcrunch.com
合规初创Delve又一个客户被攻破 TechCrunch确认,上周披露安全事故的agent训练公司Context AI,安全认证正是由Delve出具。 techcrunch.com
天文学家涌入GPU市场找星系 射电天文团队用GPU加速星系识别,进一步推高本已紧张的GPU供给。 techcrunch.com