OpenAI发GPT-5.5同日悬赏2.5万找生物越狱，Anthropic罕见公开降质postmortem

01发布GPT-5.5的同一天，OpenAI挂出2.5万美元征集生物越狱

GPT-5.5今天对所有付费用户开放。同一天，OpenAI在博客挂出一份红队悬赏：找出让模型在生物安全话题上通用失守的越狱路径，最高可拿2.5万美元。页面强调赏金只发给通用型越狱，也就是对整类危险请求都有效的绕过手法，而不是针对某个具体提问的单次绕过。

这是OpenAI第一次把生物风险做成对外悬赏。过去几代旗舰模型走的都是闭门红队路线：签几家第三方安全机构做有限测试，结果写进System Card了事。这次悬赏页面直接对全球研究者开放，任何人提交可复现的通用越狱都能申领。

同步发布的System Card给了这个动作一个解释。文档显示，新模型在生化威胁类别下的能力评估里出现了前几代没有的跃升，部分子项已接近OpenAI自己设定的高风险阈值。按其内部准备度框架，一旦模型越过阈值，就必须启动外部对抗测试——这份悬赏是规则触发后的必然动作。

生物安全漏洞从今天起走上了Web漏洞那种流程：公开征集、按条付钱、面向全球研究者。2.5万美元是这套流程里单条通用越狱的顶格价。

2.5万美元给单条生物越狱定了市场价外部红队首次从闭门合同变成公开悬赏System Card承认接近自设「高风险」阈值

来源

Introducing GPT-5.5openai.com GPT-5.5 System Cardopenai.com GPT-5.5 Bio Bug Bountyopenai.com

02Anthropic罕见公开Claude Code降质postmortem，同周OpenAI把Codex晒到400万周活

过去几周Claude Code的回答质量持续下滑。Anthropic周三发了一份postmortem，解释了哪些请求命中了问题分支、修复为什么滞后这么久。闭源AI公司公开debug相当罕见，说明投诉已经多到不能再用「未复现」搪塞。

同一周，OpenAI走的是相反方向。它把Codex推进了Accenture、PwC等大型咨询机构，首次公布400万周活用户，并推出面向企业部署的Codex Labs。

一家在向重度用户坦白质量问题、承担信任代价；另一家在把分销面铺向对可靠性要求极高的企业客户。两套不同阶段的产品动作。

Claude Code用户可以对照postmortem标出的时间窗口，排查近期遇到的异常。Codex这边的风险是：未来几个月咨询巨头的交付代码里开始承接其生成部分，一旦出现类似回退，波及的将是企业合同而非个人订阅。

Claude Code用户可按postmortem时间窗口排查近期异常Codex进咨询巨头后，回退波及的从个人订阅升级到企业合同AI编程工具从个人试用走向企业生产部署

来源

An update on recent Claude Code quality reportsanthropic.com Scaling Codex to enterprises worldwideopenai.com

03LLMs+、世界模型、agent编排：MIT把2026年的AI拆成三条主线

MIT Tech Review今年的AI清单不再把LLM当作单一未来主轴。取而代之的是三条并列路线：LLMs+、世界模型、agent编排。三条各自在补LLM的不同短板。

LLMs+往上叠推理、记忆、工具调用这些外挂层；世界模型瞄准LLM不会的物理因果和空间推理，这是让AI叠衣服、过街道的前提；agent编排面对的工程现实是，单个模型再强，多步任务也要靠系统把调度、记忆、工具、状态串起来。

真正的分野在工具链。做LLMs+的关心检索和上下文管理；做世界模型的关心仿真环境和视频数据；做agent的关心任务图和通信协议。从2026年开始，产品团队的第一个决策不再是「选哪个基础模型」，而是「自己属于哪条主线」。

工具链一旦分叉，跨主线的迁移成本会远高于切换LLM。

产品选型从选模型变为选主线世界模型和agent生态刚刚成型跨主线迁移成本远高于切换模型

来源

10 Things That Matter in AI Right Nowtechnologyreview.com LLMs+technologyreview.com World modelstechnologyreview.com Agent orchestrationtechnologyreview.com

Meta宣布5月裁员10% Meta首席人事官Janelle Gale在内部备忘录中确认，5月将裁撤约8000名员工，同时关闭约6000个空缺岗位。 theverge.com

微软在Word、Excel、PowerPoint上线Agent Mode 本周开始推送，Office版本的「vibe working」形态，替代此前面向企业的Copilot体验。 theverge.com

谷歌Workspace引入Workspace Intelligence 把一整套自动化功能塞进Docs、Gmail、Sheets，定位为「办公室实习生」。和微软Agent Mode同周亮相。 techcrunch.com

Claude接入Spotify、Uber Eats、TurboTax等个人应用 Anthropic新增一批面向生活场景的connector，包括Audible、AllTrails、TripAdvisor、Instacart等，此前connector主要覆盖办公软件。 theverge.com

Tesla把2026年capex抬到250亿美元 CFO表示开支是历史均值的三倍，公司今年剩余时间自由现金流将转负。 techcrunch.com

MIT Tech Review：中国AI实验室押注开源权重 报道梳理中美路线分歧——硅谷把模型锁在API后按token计费，中国头部实验室把模型作为「开源权重」包发布，让开发者本地部署。 technologyreview.com

DeepMind发布Decoupled DiLoCo 把通信与计算解耦的分布式训练方案，目标是在网络抖动、节点掉线等不稳定条件下仍能跑大规模训练。 deepmind.google

Bret Taylor的Sierra收购YC系Fragment 客服agent公司Sierra把法国YC毕业生Fragment收入囊中，未披露金额。 techcrunch.com

X用Grok重做时间线，Communities被替代 新的AI策划自定义feed全量上线，同时在其中插入新的广告位。 techcrunch.com

合规初创Delve又一个客户被攻破 TechCrunch确认，上周披露安全事故的agent训练公司Context AI，安全认证正是由Delve出具。 techcrunch.com

天文学家涌入GPU市场找星系 射电天文团队用GPU加速星系识别，进一步推高本已紧张的GPU供给。 techcrunch.com