AI日报 | 2026年5月18日

5天。苹果花了5年、砸了几十亿美元造的M5芯片硬件防线，Anthropic的Claude Mythos Preview只用了5天就捅穿了。

这不是电影剧本，是上周真实发生的事。

🔥 重点新闻

1. Claude 5天攻破Apple M5 macOS内核，苹果五年防线一朝崩溃

安全团队 Calif 用 Anthropic 最新的 Claude Mythos Preview，在5天内构建并演示了首个公开的、针对 Apple M5 芯片 macOS 内核的内存破坏提权利用链。

坦率的讲，这件事最让人不安的不是技术本身，而是速度。苹果的 MIE（Memory Integrity Enforcement）是硬件级安全方案，投入了巨大资源。但 Claude 从零开始，5天就绕过了整套防线。

所以呢？当AI的能力增长曲线远远超过防御工程的迭代周期，「安全」这个概念本身就需要被重新定义了。以前我们说安全是攻防博弈，现在攻方有了一个不知道累、不会犯低级错误、还能24小时不间断探索的帮手。

这不是危言耸听。这是正在发生的事。

来源，Anthropic Claude 5天攻破Apple M5 macOS内核

2. Figure人形机器人连续自主运行四天，迈向实用化关键一步

Figure 的 F.03 人形机器人已经在真实仓库环境中连续工作了四天四夜，24/7 不间断，直到出现故障才停下来。

这不是实验室演示，不是精心编排的demo。是真真实实的仓库，真实的货物，真实的抓取、搬运、分拣任务。

我一直觉得，机器人领域最缺的不是技术突破，而是「可靠性证明」。你能让它跑一天不难，跑一周呢？跑一个月呢？四天的连续测试收集的不只是成功数据，更重要的是故障模式——什么时候会出错、出什么样的错、怎么恢复。这些才是从实验室走向仓库的关键。

来源，Figure人形机器人连续自主运行四天

3. Grok Imagine 图像生成功能正式上线，所有人可用

马斯克在 X 上宣布，xAI 的 Grok Imagine 文本到图像模型正式发布，所有用户都可以使用。支持多种宽高比，主打逼真和高质量。

说实话这个赛道已经很拥挤了，Midjourney、DALL-E、Stable Diffusion、Flux，再加上各种国产模型。Grok Imagine 想要突围，光靠「逼真」两个字恐怕不够。但 xAI 有一个别人没有的东西——X 平台的分发能力。直接在 X 里生成、直接在 X 里发布，这个闭环如果跑通了，用户获取成本几乎为零。

来源，Grok Imagine正式发布

4. Ring-2.6-1T 开源，专为智能体工作流设计的万亿级推理模型

AntLingAGI 开源了 Ring-2.6-1T，一个万亿参数的推理模型，专门为现实世界的智能体构建。这个模型的设计目标很有意思——不是回答问题，而是执行任务。它专注于规划步骤、使用工具和多步推理。

现在已在 OpenRouter 上线，5月底前有75%折扣。

这让我想到一个趋势，大模型的竞争正在从「谁更聪明」转向「谁能干活」。通用能力已经卷到天花板了，接下来比的是在具体场景里能不能真正把事办了。Ring 这个定位，踩在了一个很准的点上。

来源，Ring-2.6-1T开源

5. NVIDIA 开源 SANA-WM，26亿参数世界模型生成1分钟720p视频

NVIDIA 研究团队发布了 SANA-WM，一个26亿参数的开源世界模型，能生成长达1分钟、720p分辨率的视频。

一分钟的720p视频，听起来好像不算什么对吧？但你想想，半年前我们还在为4秒的视频质量发愁。现在能生成一分钟的连贯视频了，这个进步速度真的很离谱。

世界模型的价值在于它理解物理规律——物体怎么运动、光影怎么变化、人怎么交互。这不只是视频生成，这是AI在构建对现实世界的理解。

来源，SANA-WM开源

6. 手机端 ChatGPT 集成 Codex，随时随地构建项目

OpenAI 的 Greg Brockman 透露，你现在可以在手机上通过 ChatGPT 应用中的 Codex 直接构建项目。

加上同一天 Codex 还上线了键盘快捷键自定义功能，整体使用体验又提升了一个台阶。

我有时候觉得，编程这件事正在经历一个根本性的变化。以前你得坐在电脑前，打开IDE，配置环境。现在掏出手机，跟AI说句话，代码就跑起来了。工具在消解「编程」这件事的门槛，越来越多的人会成为「会写代码的人」，即使他们从来不会写传统意义上的代码。

来源，手机ChatGPT集成Codex

7. GBrain 开源，Garry Tan 的AI记忆系统捅破个人AI天花板

Y Combinator 总裁 Garry Tan 开源了 GBrain，一个8层结构的知识系统。前4层升级基础检索能力，后4层实现终身记忆和自我进化。

这个项目的核心洞察很准，现在的AI Agent最大的问题不是不够聪明，而是记不住东西。你跟它聊了三个月，它对你还是一无所知。GBrain 想解决的就是这个问题——让 Agent 能持续追踪你的人际关系、工作习惯、知识积累。

如果你在用 Hermes 或者 OpenClaw 这类 Agent，值得关注一下这个项目。

来源，GBrain开源

8. 美国开始出现AI相关岗位大规模裁员

彭博社报道，美国受AI影响的职位正在经历严重的就业流失。AI对劳动力市场的冲击已经从「狼来了」的理论讨论，进入了真刀真枪的现实阶段。

与此同时，微软 AI CEO Mustafa Suleyman 预测，AI将在18个月内实现人类水平的性能，自动化大多数白领工作。Anthropic CEO Dario Amodei 也在说类似的话，软件成本将急剧下降，可能基本免费。

三件事放在一起看，画面就很清晰了。我始终坚信技术进步最终会让所有人受益，但「最终」这个词背后可能藏着很多人职业生涯中最痛苦的一段转型期。

来源，美国AI岗位裁员

💡 值得关注

api-relay-audit，一个开源工具，专门检测AI API中转站的「掺水」「造假」问题。如果你用了第三方API代理，建议跑一下来源
yao-weread-skill，微信读书数据可视化工具，能把你的阅读数据生成包含26个图表的专业报告。涵盖阅读时长、分类偏好、笔记分析等来源
杭州国家具身智能基地正式挂牌启用，这是集场景体验、技术展示、研发合作于一体的综合平台，杭州5月1日还施行了首部具身智能地方性法规来源
Anthropic 发布《Founder’s Playbook》，核心观点很反直觉，AI（比如 Claude Code）会提高创业失败率而非降低。原因是你很容易把「能运行」和「有市场需求」搞混来源
开源模型大爆发，Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5、GLM-5.1 密集发布，Nathan Lambert 的最新一期 Open Artifacts 做了完整梳理来源

📝 今日思考

今天最有意思的观察是，AI正在同时从两端「夹击」人类。

一端是创造力，Claude 5天攻破硬件安全防线，Grok 直接在社交平台生成图像，NVIDIA 的世界模型开始理解物理规律。

另一端是就业，彭博社说裁员开始了，微软和 Anthropic 的 CEO 都在说白领工作即将被自动化。

这两个方向看起来矛盾，其实是一体两面。AI越强，能替代的工作就越多，但同时能创造的新可能性也越多。

关键问题不是「AI会不会取代我」，而是「我能不能比AI更快地学会用AI」。

这个周末花点时间想想这个问题，比刷任何新闻都有价值。