AI日报 | 2026年5月7日

Anthropic 抱上了 SpaceX 的大腿，22 万块 GPU 到手的当天就把 Claude Code 的速率限制翻倍了。

这件事放在今天一堆 AI 新闻里看，信号其实很明确，算力军备竞赛已经进入了「找非传统数据中心」的阶段。

🔥 重点新闻

1. Anthropic 与 SpaceX 达成算力合作，Claude Code 限制大幅放宽

Anthropic 宣布与 SpaceX 签署协议，将使用 Colossus 1 数据中心的全部算力容量。这意味着超过 300 兆瓦的新容量，超过 22 万块 NVIDIA GPU，一个月内部署到位。

同一天生效的三个变化：

Claude Code 的五小时速率限制翻倍（Pro、Max、Team、Enterprise 都包含）
Pro 和 Max 账户取消高峰时段限制削减
Claude Opus 模型的 API 速率限制大幅提升

坦率的讲，这个合作挺让人意外的。SpaceX 的数据中心本来是给 xAI 用的，现在 Anthropic 也来分一杯羹，说明算力市场的供需关系比我们想象的更紧张。

对 Claude Code 用户来说，这是实打实的好消息。之前高峰期被限流的痛，应该能缓解不少。

来源：Anthropic 官方博客

2. Cloudflare 联手 Stripe，AI Agent 可以自动创建账户、购买域名并部署

这个新闻在 Hacker News 上拿了 620 分，热度相当高。

Cloudflare 宣布，AI Agent 现在可以代表用户完成一系列操作：创建 Cloudflare 账户、启动付费订阅、注册域名、获取 API Token，然后直接部署代码。整套流程通过一个新协议实现，这个协议是和 Stripe 联合设计的，作为 Stripe Projects 发布的一部分。

你想想看，这意味着什么？一个 coding agent 写完代码之后，不再需要人类手动去开通云服务、配置域名、设置支付。agent 自己就能搞定这一切。

当然，人类仍然需要在关键节点授权，也必须接受服务条款。但方向已经很明确了，agent 正在获得越来越多的「自主行动权」。

来源：Cloudflare 博客

3. Simon Willison 的自我反思：Vibe Coding 和 Agentic Engineering 正在趋同

Simon Willison 一直是「vibe coding 和负责任的 AI 编程是两码事」的坚定支持者。但在最近一期播客里，他承认了一个让他「相当不安」的发现：这两者在他自己的工作中已经开始模糊了。

他的原话是：「令人不安的是，这些东西对我来说已经开始模糊了。」

以前的界限很清楚：vibe coding 是不看代码、不懂编程也能用的方式，适合个人工具；而 agentic engineering 是负责任地使用 AI 写代码，适用于给别人用的软件。

但现在呢？当你越来越多地依赖 agent 来处理代码，你审查代码的深度其实在下降。这不是偷懒，是效率的必然代价。

这个观察很诚实。我自己也有类似的感受，用 Claude Code 写代码的时候，review 的颗粒度确实变粗了。

来源：Simon Willison 博客

4. 编码 Agent 的瓶颈从来不是代码

这篇文章在 HN 上有 494 分，作者是 .txt 公司的人，讲了一个很有趣的实验：他们推迟了一年多的结构化生成算法实验，用 Codex 半小时就搞出了可用的第一版。

但作者的观点恰恰相反：个体生产力的提升不等于行业整体的加速。

核心论点是：有影响力的软件通常需要很多人协作完成。而关于 coding agent 的讨论几乎都聚焦在个体生产力上，协作才是真正值得关注的分析单元。

怎么说呢，这个观点我部分同意。确实，代码写得快不等于产品做得好。但我觉得作者低估了一点，当个体生产力大幅提升后，团队协作的模式本身也会改变。以前需要 5 个人的项目，可能 2 个人就够了，协作成本自然就降了。

来源：The Typical Set

5. SubQ：亚二次方 LLM，支持 1200 万 token 上下文

Transformer 的二次方计算限制一直是长上下文的硬伤。每多一个 token，计算量就指数级增长，所以实际应用中上下文窗口总是不够用。

SubQ 打破了这个限制。他们构建了一个亚二次方复杂度的 LLM，能够处理 1200 万 token 的上下文，而且不会出现传统长上下文模型那种「信息越多反而越找不到重点」的问题。

他们的 CEO 说得很直接：「业界花在绕过 transformer 限制上的时间和金钱，比花在解决这个问题本身上的还多。RAG、分块策略、prompt engineering，都是权宜之计。」

1200 万 token 是什么概念？大概是一个完整代码仓库加几个月的聊天历史。如果这真能跑起来，很多 RAG 架构可能就不需要了。

来源：SubQ 官网

6. Google Cloud 推出 Fraud Defense，reCAPTCHA 的下一代

Google 在 Cloud Next 上发布了 Google Cloud Fraud Defense，定位是「agentic web 时代的信任平台」。

背景是这样的：当 AI agent 能够自主执行复杂交易（比如下单、注册、支付），传统的验证码已经不够用了。你需要一个能区分「合法 agent」和「恶意自动化」的系统。

这个产品的发布时序很有意思，刚好在 Cloudflare 宣布 agent 可以自动部署的同一天。一个在放权，一个在建护栏，整个行业在同时推进。

来源：Google Cloud 博客

💡 值得关注

Tilde.run：一个 AI agent 沙箱，把每次 agent 运行变成可回滚的事务。GitHub 代码、S3 数据、Drive 文件统一成一个版本化文件系统。终于有人认真解决 agent 安全执行的问题了。tilde.run
Hallucinopedia：名字就很直白，一个关于 AI 幻觉的百科全书。halupedia.com
Meta 被出版商和作家 Scott Turow 起诉：指控扎克伯格「亲自授权」Meta 使用受版权保护的内容训练 Llama 模型。AI 训练数据的版权之争还在持续升级。