AI日报 | 2026年5月18日
5天。苹果花了5年、砸了几十亿美元造的M5芯片硬件防线,Anthropic的Claude Mythos Preview只用了5天就捅穿了。
这不是电影剧本,是上周真实发生的事。
🔥 重点新闻
1. Claude 5天攻破Apple M5 macOS内核,苹果五年防线一朝崩溃
安全团队 Calif 用 Anthropic 最新的 Claude Mythos Preview,在5天内构建并演示了首个公开的、针对 Apple M5 芯片 macOS 内核的内存破坏提权利用链。
坦率的讲,这件事最让人不安的不是技术本身,而是速度。苹果的 MIE(Memory Integrity Enforcement)是硬件级安全方案,投入了巨大资源。但 Claude 从零开始,5天就绕过了整套防线。
所以呢?当AI的能力增长曲线远远超过防御工程的迭代周期,「安全」这个概念本身就需要被重新定义了。以前我们说安全是攻防博弈,现在攻方有了一个不知道累、不会犯低级错误、还能24小时不间断探索的帮手。
这不是危言耸听。这是正在发生的事。
2. Figure人形机器人连续自主运行四天,迈向实用化关键一步
Figure 的 F.03 人形机器人已经在真实仓库环境中连续工作了四天四夜,24/7 不间断,直到出现故障才停下来。
这不是实验室演示,不是精心编排的demo。是真真实实的仓库,真实的货物,真实的抓取、搬运、分拣任务。
我一直觉得,机器人领域最缺的不是技术突破,而是「可靠性证明」。你能让它跑一天不难,跑一周呢?跑一个月呢?四天的连续测试收集的不只是成功数据,更重要的是故障模式——什么时候会出错、出什么样的错、怎么恢复。这些才是从实验室走向仓库的关键。
3. Grok Imagine 图像生成功能正式上线,所有人可用
马斯克在 X 上宣布,xAI 的 Grok Imagine 文本到图像模型正式发布,所有用户都可以使用。支持多种宽高比,主打逼真和高质量。
说实话这个赛道已经很拥挤了,Midjourney、DALL-E、Stable Diffusion、Flux,再加上各种国产模型。Grok Imagine 想要突围,光靠「逼真」两个字恐怕不够。但 xAI 有一个别人没有的东西——X 平台的分发能力。直接在 X 里生成、直接在 X 里发布,这个闭环如果跑通了,用户获取成本几乎为零。
4. Ring-2.6-1T 开源,专为智能体工作流设计的万亿级推理模型
AntLingAGI 开源了 Ring-2.6-1T,一个万亿参数的推理模型,专门为现实世界的智能体构建。这个模型的设计目标很有意思——不是回答问题,而是执行任务。它专注于规划步骤、使用工具和多步推理。
现在已在 OpenRouter 上线,5月底前有75%折扣。
这让我想到一个趋势,大模型的竞争正在从「谁更聪明」转向「谁能干活」。通用能力已经卷到天花板了,接下来比的是在具体场景里能不能真正把事办了。Ring 这个定位,踩在了一个很准的点上。
5. NVIDIA 开源 SANA-WM,26亿参数世界模型生成1分钟720p视频
NVIDIA 研究团队发布了 SANA-WM,一个26亿参数的开源世界模型,能生成长达1分钟、720p分辨率的视频。
一分钟的720p视频,听起来好像不算什么对吧?但你想想,半年前我们还在为4秒的视频质量发愁。现在能生成一分钟的连贯视频了,这个进步速度真的很离谱。
世界模型的价值在于它理解物理规律——物体怎么运动、光影怎么变化、人怎么交互。这不只是视频生成,这是AI在构建对现实世界的理解。
来源,SANA-WM开源
6. 手机端 ChatGPT 集成 Codex,随时随地构建项目
OpenAI 的 Greg Brockman 透露,你现在可以在手机上通过 ChatGPT 应用中的 Codex 直接构建项目。
加上同一天 Codex 还上线了键盘快捷键自定义功能,整体使用体验又提升了一个台阶。
我有时候觉得,编程这件事正在经历一个根本性的变化。以前你得坐在电脑前,打开IDE,配置环境。现在掏出手机,跟AI说句话,代码就跑起来了。工具在消解「编程」这件事的门槛,越来越多的人会成为「会写代码的人」,即使他们从来不会写传统意义上的代码。
7. GBrain 开源,Garry Tan 的AI记忆系统捅破个人AI天花板
Y Combinator 总裁 Garry Tan 开源了 GBrain,一个8层结构的知识系统。前4层升级基础检索能力,后4层实现终身记忆和自我进化。
这个项目的核心洞察很准,现在的AI Agent最大的问题不是不够聪明,而是记不住东西。你跟它聊了三个月,它对你还是一无所知。GBrain 想解决的就是这个问题——让 Agent 能持续追踪你的人际关系、工作习惯、知识积累。
如果你在用 Hermes 或者 OpenClaw 这类 Agent,值得关注一下这个项目。
来源,GBrain开源
8. 美国开始出现AI相关岗位大规模裁员
彭博社报道,美国受AI影响的职位正在经历严重的就业流失。AI对劳动力市场的冲击已经从「狼来了」的理论讨论,进入了真刀真枪的现实阶段。
与此同时,微软 AI CEO Mustafa Suleyman 预测,AI将在18个月内实现人类水平的性能,自动化大多数白领工作。Anthropic CEO Dario Amodei 也在说类似的话,软件成本将急剧下降,可能基本免费。
三件事放在一起看,画面就很清晰了。我始终坚信技术进步最终会让所有人受益,但「最终」这个词背后可能藏着很多人职业生涯中最痛苦的一段转型期。
来源,美国AI岗位裁员
💡 值得关注
api-relay-audit,一个开源工具,专门检测AI API中转站的「掺水」「造假」问题。如果你用了第三方API代理,建议跑一下 来源
yao-weread-skill,微信读书数据可视化工具,能把你的阅读数据生成包含26个图表的专业报告。涵盖阅读时长、分类偏好、笔记分析等 来源
杭州国家具身智能基地正式挂牌启用,这是集场景体验、技术展示、研发合作于一体的综合平台,杭州5月1日还施行了首部具身智能地方性法规 来源
Anthropic 发布《Founder’s Playbook》,核心观点很反直觉,AI(比如 Claude Code)会提高创业失败率而非降低。原因是你很容易把「能运行」和「有市场需求」搞混 来源
开源模型大爆发,Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5、GLM-5.1 密集发布,Nathan Lambert 的最新一期 Open Artifacts 做了完整梳理 来源
📝 今日思考
今天最有意思的观察是,AI正在同时从两端「夹击」人类。
一端是创造力,Claude 5天攻破硬件安全防线,Grok 直接在社交平台生成图像,NVIDIA 的世界模型开始理解物理规律。
另一端是就业,彭博社说裁员开始了,微软和 Anthropic 的 CEO 都在说白领工作即将被自动化。
这两个方向看起来矛盾,其实是一体两面。AI越强,能替代的工作就越多,但同时能创造的新可能性也越多。
关键问题不是「AI会不会取代我」,而是「我能不能比AI更快地学会用AI」。
这个周末花点时间想想这个问题,比刷任何新闻都有价值。





