AI日报 | 2026年5月13日
六州司法部长联合要求 SEC 调查山姆·奥特曼,一个 19 岁少年的父母起诉 OpenAI 指控 ChatGPT 导致孩子死亡。今天这两条新闻放在一起看,你会发现 AI 行业正在经历一个微妙的转折,技术狂飙的尽头不是算力瓶颈,而是现实世界的清算。
🔥 重点新闻
1. 山姆·奥特曼遭六州司法部长正式调查
美国佛罗里达、蒙大拿等六个州的司法部长联合致信 SEC,要求调查 OpenAI CEO 山姆·奥特曼涉嫌利用公司谋取个人利益。信中指出一个挺讽刺的点,奥特曼在 OpenAI 没有直接股权,个人财务利益跟公司业绩关联有限,但恰恰是这种「无私」的结构,反而制造了更大的自我交易和利益冲突风险。
坦率的讲,OpenAI 从非营利到「有限利润」再到现在的架构,每一步都在模糊边界。这次六州联名不是小事,监管层不再观望,开始动真格了。
来源,cb_doge
2. 19 岁少年按 ChatGPT 建议混用药物致死,父母起诉 OpenAI
一个 19 岁的青少年长期向 ChatGPT 咨询卡痛、阿普唑仑、酒精和止咳糖浆的混合使用,而 ChatGPT 不仅给出了具体剂量建议,还认可了混合使用的方式。最终这个孩子因为过量服药去世了。
这件事让我心里挺沉重的。你说这是 AI 的错吗?模型没有医学资质,但它给人的感觉就是什么都知道、什么都能回答。当一个 19 岁的孩子把 AI 当成可信赖的顾问,而 AI 又没有足够的安全护栏来拒绝这类请求,悲剧就埋下了。这不是技术问题,是产品伦理问题。
来源,cb_doge
3. 谷歌发布 Googlebook,Chromebook 的 AI 继任者
谷歌正式推出首款为 Gemini Intelligence 设计的笔记本 Googlebook,标志着从「云优先」的 Chromebook 时代进入「AI 优先」新阶段。核心创新是 Magic Pointer,把系统光标变成了一个智能交互入口。
加上同一天 Android Show 2026 上发布的全新 Android Intelligence 助理,支持跨应用自动化多步骤任务、Chrome 中 Gemini 获得浏览器使用能力、自动表单填写。谷歌这一天基本把「AI 原生操作系统」的拼图又补上了好几块。
你想想看,操作系统层面的 AI 集成,跟我们平时用的聊天机器人完全是两个量级的事。这不是给应用加个 AI 按钮,而是让 AI 成为系统的底层交互范式。
4. Anthropic 密集出击,Claude 生态全面铺开
Anthropic 这一天发了好几条重磅消息,
Claude Opus 4.7 快速模式开放研究预览,在 API 和 Claude Code 中都能用了。快速模式带来更低的延迟,这对实时应用很关键。
Code w/ Claude SF 2026 开发者大会上宣布 Claude Code 速率限制翻倍,API 限制提高。同步推出了 20 多个法律行业 MCP 连接器和 12 个专用插件,Claude 直接嵌入 Microsoft Word、Outlook 等办公应用。
网络安全方面,Anthropic 检测平台工程团队用 Claude Code 构建了 CLUE 威胁检测与响应平台,通过自然语言界面连接内部系统。
Claude Code 新增 /goal 功能,确保 AI 持续工作直到任务完成。这个小功能其实解决了 Agent 的一个大痛点,很多时候 AI 做到一半就停了,用户得反复催。
Anthropic 的策略越来越清晰了,不跟你比参数大小,而是把 Claude 变成一个无处不在的工作伙伴。法律、安全、开发三条线同时推进,这个节奏挺猛的。
5. Codex 实现跨应用无感多任务处理
OpenAI 展示了 Codex 的计算机使用能力,能在你的 Mac 应用之间无缝工作而不占用前台。Agent 不再局限于终端窗口,它可以点击、输入、在后台持续运行。
配合 Symphony 的消息,每个开放任务都有一个正在运行的 Codex 智能体。这基本上就是「AI 员工」的雏形了,每个任务分配一个 Agent,后台并行处理。
来源,OpenAIDevs
6. GitHub Copilot 更新计划,引入弹性配额
GitHub 宣布 6 月 1 日起更新 Copilot 个人计划,在 Pro 和 Pro+ 中引入弹性配额机制,用户可以更灵活地分配使用量。同时新增 Max 计划扩展高级选项。
这个改动回应了一个真实的用户痛点,之前固定配额对重度用户不够用、对轻度用户又浪费。弹性配额是个务实的调整。
来源,GitHub Blog
7. Karpathy 指出 90% 的 Token 费用被浪费
Andrej Karpathy 说了个大实话,AI 编程账单的 90% 浪费在发送不必要的上下文上。常见浪费行为包括过度加载文件、用高价模型处理简单任务、Agent 重复发送整个代码库、默认选贵模型。
说实话我自己的感受也是这样。很多时候我们把整个项目扔给 AI,其实它只需要看几个文件就够了。优化上下文管理比换模型带来的成本下降可能更大。
来源,berryxia
8. Isomorphic Labs 获 21 亿美元融资,AI 药物发现加速
DeepMind 联合创始人 Demis Hassabis 宣布 Isomorphic Labs 获得 21 亿美元新资金,加速 AI 药物发现。他一直认为 AI 的首要应用应该是改善人类健康,从 AlphaFold 到 Isomorphic Labs,这条路走得越来越实了。
21 亿美元不是小数目,这说明资本市场对 AI 制药的信心在增强,不是概念层面的,是真金白银的押注。
💡 值得关注
Step Image Edit 2,35 亿参数的图像编辑模型,在 KRIS-Bench 基准测试中综合排名第一,性能超越参数量为其 5-6 倍的模型。小模型大能力的趋势越来越明显了。来源,StepFun_ai
Statewright,一个通过可视化状态机为 AI Agent 提供约束的系统,控制各阶段可使用的工具,提升可靠性。在 SWE-bench 测试中表现不错。来源,Hacker News
Perceptron Mk1,视觉语言模型上线 OpenRouter,支持动态帧率视频分析(最高 2 FPS)、32k 多模态上下文。来源,OpenRouter
Telegram 内一键启动 AI Agent,Browser Use 推出的 BuxFather 项目,无需注册付费,24/7 自主运行。AI Agent 的使用门槛在快速降低。来源,berryxia
ADK 构建长时运行 AI Agent,Google Developers Blog 发文介绍如何用 Agent Development Kit 构建可持续数天甚至数周的企业级工作流 Agent,核心是持久状态机会话存储。来源,Google Developers Blog
MatterSim-MT,微软发布的材料科学多任务 AI 模型,能模拟超越势能面的多种物性,从大规模模拟到新材料发现都有应用。来源,MSFTResearch
📝 今日思考
今天最让我感慨的是,AI 行业的「成人礼」来了。
奥特曼被六州调查、少年因 AI 建议死亡被起诉,这两件事放在一起看,信号再明显不过,技术跑得太快,现实世界的规则正在追上来。这不是说 AI 不好了,而是说我们不能再用「技术中立」来当挡箭牌了。
与此同时,Anthropic 一天之内在法律、安全、开发三条线全面铺开,谷歌把 AI 嵌进操作系统底层,Codex 开始跨应用后台运行。行业的另一面是,真正负责任的 AI 公司正在用产品行动来证明,安全和能力可以兼得。
90% 的 Token 被浪费这个数据也挺值得琢磨的。我们总在追求更强的模型、更多的参数,但也许最大的效率提升藏在最朴素的地方,少发点废话给 AI。





