AI日报 | 2026年5月20日
1146 个 upvote,Karpathy 一条 “I’ve joined Anthropic” 的推文直接炸了 Hacker News 首页。同一天,Google 甩出 Gemini 3.5 Flash 和 Gemini Omni 两个新模型,苹果在 WWDC 前夕发布了 Apple Intelligence 驱动的无障碍功能。AI 圈从来不缺大新闻,但今天这密度,属实有点离谱。
🔥 重点新闻
1. Karpathy 加入 Anthropic
AI 圈今天最大的新闻,没有之一。前 OpenAI 联合创始人、Tesla AI 总监 Andrej Karpathy 在推特上宣布加入 Anthropic。HN 上 1146 个 upvote,评论区直接炸了。
坦率的讲,这个选择挺有意思的。Karpathy 在 OpenAI 和 Tesla 都待过,最后选了 Anthropic,多少能说明一些问题。Anthropic 最近在安全研究和产品化上的节奏确实很猛,Claude Code 的口碑也起来了。大牛的去向往往是行业风向标,这次也不例外。
来源,Hacker News / Twitter
2. Google 发布 Gemini 3.5 Flash 和 Gemini Omni
Google 一口气发了两个模型。Gemini 3.5 Flash 主打速度和性价比,Gemini Omni 则是多模态方向的新探索。36kr 的标题写得挺到位,「谷歌用 AI 杀死谷歌」,看得人缺氧。
你想想看,Google 在模型层面的迭代速度已经快到什么程度了?从 Gemini 1.0 到 2.0 到 2.5 再到现在的 3.5,基本上是每隔几个月就有新东西出来。Flash 系列一直走的是「便宜好用」路线,这次 3.5 版本估计又把性价比拉到了一个新高度。
来源,Google AI Blog / 36kr
3. OpenAI 采用 Google 的 SynthID 水印技术
OpenAI 宣布在 AI 生成图片中采用 Google 的 SynthID 水印,并推出验证工具。你没看错,OpenAI 用了 Google 的技术。这在以前是不可想象的事情。
这个事情的意义比表面上看起来大。AI 生成内容的真伪辨别一直是个老大难问题,现在两大巨头在水印标准上开始趋同,说明行业正在往「可验证」的方向走。对普通用户来说,以后看到一张图,可能很快就能知道是不是 AI 生成的。
来源,OpenAI Blog
4. Mistral AI 收购 Emmi AI
法国 AI 公司 Mistral 收购了 Emmi AI,目标是打造「领先的 AI 技术栈」。Mistral 一直是欧洲 AI 的旗帜,这次收购说明他们在往全栈方向走,不只想做模型,还想做基础设施。
来源,Emmi AI Blog
5. Forge,用 Guardrails 把 8B 模型从 53% 拉到 99%
这是 HN 上一个 Show HN 项目,242 个 upvote。Forge 是一个 guardrails 框架,专门针对 agentic 任务场景,能把 8B 参数的小模型从 53% 的成功率提升到 99%。
这个数据太猛了。你想想看,8B 模型本来算是「轻量级」的,但加上合适的 guardrails 之后,效果直接逼近大模型。这对那些想在端侧部署 AI agent 的开发者来说,是个非常有价值的思路。不是一味堆参数,而是用工程手段弥补模型能力的不足。
来源,GitHub / Hacker News
6. Apple 发布基于 Apple Intelligence 的无障碍功能
苹果在 WWDC 2026 前夕放出了新的无障碍功能更新,核心是用 Apple Intelligence 来增强辅助体验。584 个 upvote,说明大家对苹果在 AI 落地方面的动作还是很关注的。
苹果做 AI 一直走的是「润物细无声」路线,不像 OpenAI 和 Google 那样高调发模型,而是把 AI 能力藏在系统功能里。这次的无障碍功能是个典型例子,用户感知到的是「更好用了」,而不是「这是 AI」。
来源,Apple Newsroom
7. DeepSeek 回应用户「对话泄露」疑虑
36kr 报道,DeepSeek 针对用户对话数据泄露的疑虑做出了回应。具体细节还在看,但这个问题其实戳到了所有 AI 产品的一个痛点,你的对话数据到底安不安全?
说实话我也不确定有多少用户真的在意这个。大部分人用 AI 的时候,想的还是「能不能帮我解决问题」,而不是「我的数据去哪了」。但随着 AI 越来越深入日常,隐私问题迟早会浮出水面。
来源,36kr
8. AI Agent 记忆机制被质疑,港中大浙大联合研究
港中大和浙大的研究团队发表论文,指出当前 AI Agent 的记忆机制存在严重问题,「越用越蠢」不是错觉,而是有论文支撑的事实。36kr 的标题很直白,「你的 AI Agent 越用越蠢?戳破记忆的谎言」。
这个研究方向非常重要。现在大家都在做 Agent,但记忆管理一直是被低估的问题。如果长期记忆的设计有问题,那 Agent 用久了确实会「退化」。想想就觉得兴奋,这种基础研究才是真正推动行业进步的东西。
来源,36kr / 港中大浙大论文
💡 值得关注
- Composer 2.5,编程领域的新玩家,据说逼近 Opus 4.7 的能力,成本只有十分之一。36kr 称之为「编程新王」,值得关注。
- OpenClaw 访问量腰斩,曾经爆火的「龙虾」热正在退潮,QClaw 暴跌 99%。AI 产品的热度衰减速度,比想象中快得多。
- 马斯克加速满血智驾落地中国,9 城急招测试人员,要求能国内外出差。特斯拉 FSD 在中国的落地节奏明显加快了。
- CISA 管理员在 GitHub 泄露 AWS GovCloud 密钥,390 个 upvote。安全事件年年有,政府部门的失误格外扎眼。
📝 今日思考
Karpathy 去 Anthropic 这事儿,我反复想了好几遍。一个在 OpenAI 和 Tesla 都深度参与过 AI 核心工作的人,最后选了 Anthropic,这本身就是一个很强的信号。
Anthropic 最近一年的节奏确实稳,Claude 模型迭代快、Claude Code 的产品化做得好、安全研究也一直在推进。和 OpenAI 的「大跃进」式路线相比,Anthropic 更像是一步一个脚印在走。
你如果关注这个领域的话,会发现 AI 行业的人才流动一直在加速。去年是各大公司抢人,今年开始出现「大牛主动选择阵营」的趋势。这种选择背后,往往是对技术路线和公司文化的深度认同。
今天还有一个值得关注的信号,OpenAI 用了 Google 的 SynthID 技术。竞争对手之间的技术合作,在 AI 领域越来越常见。这说明大家开始意识到,有些问题靠单打独斗解决不了,比如 AI 生成内容的可信度问题。行业在「卷」的同时,也在某些点上慢慢「合」。





