Anthropic 抱上了 SpaceX 的大腿,22 万块 GPU 到手的当天就把 Claude Code 的速率限制翻倍了。

这件事放在今天一堆 AI 新闻里看,信号其实很明确,算力军备竞赛已经进入了「找非传统数据中心」的阶段。

🔥 重点新闻

1. Anthropic 与 SpaceX 达成算力合作,Claude Code 限制大幅放宽

Anthropic 宣布与 SpaceX 签署协议,将使用 Colossus 1 数据中心的全部算力容量。这意味着超过 300 兆瓦的新容量,超过 22 万块 NVIDIA GPU,一个月内部署到位。

同一天生效的三个变化:

  • Claude Code 的五小时速率限制翻倍(Pro、Max、Team、Enterprise 都包含)
  • Pro 和 Max 账户取消高峰时段限制削减
  • Claude Opus 模型的 API 速率限制大幅提升

坦率的讲,这个合作挺让人意外的。SpaceX 的数据中心本来是给 xAI 用的,现在 Anthropic 也来分一杯羹,说明算力市场的供需关系比我们想象的更紧张。

对 Claude Code 用户来说,这是实打实的好消息。之前高峰期被限流的痛,应该能缓解不少。

来源:Anthropic 官方博客

2. Cloudflare 联手 Stripe,AI Agent 可以自动创建账户、购买域名并部署

这个新闻在 Hacker News 上拿了 620 分,热度相当高。

Cloudflare 宣布,AI Agent 现在可以代表用户完成一系列操作:创建 Cloudflare 账户、启动付费订阅、注册域名、获取 API Token,然后直接部署代码。整套流程通过一个新协议实现,这个协议是和 Stripe 联合设计的,作为 Stripe Projects 发布的一部分。

你想想看,这意味着什么?一个 coding agent 写完代码之后,不再需要人类手动去开通云服务、配置域名、设置支付。agent 自己就能搞定这一切。

当然,人类仍然需要在关键节点授权,也必须接受服务条款。但方向已经很明确了,agent 正在获得越来越多的「自主行动权」。

来源:Cloudflare 博客

3. Simon Willison 的自我反思:Vibe Coding 和 Agentic Engineering 正在趋同

Simon Willison 一直是「vibe coding 和负责任的 AI 编程是两码事」的坚定支持者。但在最近一期播客里,他承认了一个让他「相当不安」的发现:这两者在他自己的工作中已经开始模糊了。

他的原话是:「令人不安的是,这些东西对我来说已经开始模糊了。」

以前的界限很清楚:vibe coding 是不看代码、不懂编程也能用的方式,适合个人工具;而 agentic engineering 是负责任地使用 AI 写代码,适用于给别人用的软件。

但现在呢?当你越来越多地依赖 agent 来处理代码,你审查代码的深度其实在下降。这不是偷懒,是效率的必然代价。

这个观察很诚实。我自己也有类似的感受,用 Claude Code 写代码的时候,review 的颗粒度确实变粗了。

来源:Simon Willison 博客

4. 编码 Agent 的瓶颈从来不是代码

这篇文章在 HN 上有 494 分,作者是 .txt 公司的人,讲了一个很有趣的实验:他们推迟了一年多的结构化生成算法实验,用 Codex 半小时就搞出了可用的第一版。

但作者的观点恰恰相反:个体生产力的提升不等于行业整体的加速。

核心论点是:有影响力的软件通常需要很多人协作完成。而关于 coding agent 的讨论几乎都聚焦在个体生产力上,协作才是真正值得关注的分析单元。

怎么说呢,这个观点我部分同意。确实,代码写得快不等于产品做得好。但我觉得作者低估了一点,当个体生产力大幅提升后,团队协作的模式本身也会改变。以前需要 5 个人的项目,可能 2 个人就够了,协作成本自然就降了。

来源:The Typical Set

5. SubQ:亚二次方 LLM,支持 1200 万 token 上下文

Transformer 的二次方计算限制一直是长上下文的硬伤。每多一个 token,计算量就指数级增长,所以实际应用中上下文窗口总是不够用。

SubQ 打破了这个限制。他们构建了一个亚二次方复杂度的 LLM,能够处理 1200 万 token 的上下文,而且不会出现传统长上下文模型那种「信息越多反而越找不到重点」的问题。

他们的 CEO 说得很直接:「业界花在绕过 transformer 限制上的时间和金钱,比花在解决这个问题本身上的还多。RAG、分块策略、prompt engineering,都是权宜之计。」

1200 万 token 是什么概念?大概是一个完整代码仓库加几个月的聊天历史。如果这真能跑起来,很多 RAG 架构可能就不需要了。

来源:SubQ 官网

6. Google Cloud 推出 Fraud Defense,reCAPTCHA 的下一代

Google 在 Cloud Next 上发布了 Google Cloud Fraud Defense,定位是「agentic web 时代的信任平台」。

背景是这样的:当 AI agent 能够自主执行复杂交易(比如下单、注册、支付),传统的验证码已经不够用了。你需要一个能区分「合法 agent」和「恶意自动化」的系统。

这个产品的发布时序很有意思,刚好在 Cloudflare 宣布 agent 可以自动部署的同一天。一个在放权,一个在建护栏,整个行业在同时推进。

来源:Google Cloud 博客

💡 值得关注

  • Tilde.run:一个 AI agent 沙箱,把每次 agent 运行变成可回滚的事务。GitHub 代码、S3 数据、Drive 文件统一成一个版本化文件系统。终于有人认真解决 agent 安全执行的问题了。tilde.run
  • Hallucinopedia:名字就很直白,一个关于 AI 幻觉的百科全书。halupedia.com
  • Meta 被出版商和作家 Scott Turow 起诉:指控扎克伯格「亲自授权」Meta 使用受版权保护的内容训练 Llama 模型。AI 训练数据的版权之争还在持续升级。

📝 今日思考

今天最有意思的观察是:agent 生态正在同时发生两件事。

一边是能力扩张,agent 能做的事越来越多,从写代码到买域名到部署上线,全链条打通。Cloudflare 和 Stripe 的合作就是典型。

另一边是安全护栏的建立,Google 的 Fraud Defense、Tilde.run 的可回滚沙箱,都是在给 agent 划边界。

这两股力量会同时存在、互相拉扯。放权太快会出事,限制太多又会扼杀创新。接下来半年,这个平衡点在哪里,会是整个行业最值得关注的事情。

Simon Willison 的那篇文章也值得深思。当我们越来越依赖 agent,「负责任地使用 AI」这个标准本身也在变化。以前觉得要逐行 review 代码才算负责任,现在可能「理解架构决策、验证关键路径」就够了。这不是偷懒,是新的工作方式。