AI日报 | 2026年5月6日
你打开 Chrome,发现内存莫名其妙少了 4 个 G。
不是你的标签页太多了,是 Google 偷偷塞了一个 AI 模型进来。这件事昨天在 Hacker News 上拿了 1200 多票,评论区炸了。
今天我们聊聊这件事,以及其他几条值得你关注的 AI 动态。
🔥 重点新闻
1. Chrome 偷偷往你电脑塞了一个 4GB 的 AI 模型
事情是这样的。
有开发者发现,Google Chrome 在用户完全不知情的情况下,悄悄下载并安装了一个约 4GB 的 Gemini Nano AI 模型。没有弹窗确认,没有设置选项,就这么静默完成了。
这个模型跑在设备端,主要用于 Chrome 内置的 AI 功能。但问题在于,4GB 不是个小数目。对很多用户来说,这可能是硬盘空间的 10% 甚至更多。
Hacker News 上这条新闻拿了 1200+ 票,评论区的愤怒几乎是一边倒的。
坦率的讲,这暴露了一个更大的趋势。大厂越来越倾向于把 AI 功能「推」给用户,而不是让用户主动选择。Chrome 的市场占有率摆在那里,它有能力做这种事。但「有能力」和「应该做」是两码事。
我一直觉得,软件更新应该让用户有知情权。尤其是涉及到 GB 级别的下载和本地模型运行,这已经不是一个小功能更新了。
2. Google 给 Gemma 4 加了多 token 预测,推理速度起飞
Google 昨天发了一篇技术博客,介绍了如何用多 token 预测(Multi-token Prediction)来加速 Gemma 4 的推理。
简单来说,传统的自回归模型每次只预测一个 token,而多 token 预测让模型一次猜好几个 token,然后用一个小的验证器来检验哪些猜测是对的。这样可以在不牺牲质量的情况下,把推理速度提升 2-3 倍。
这个技术其实在学术界讨论了挺久了,Google 这次是真正在开源模型上做了工程化落地。
如果你在用 Gemma 系列做本地部署或者边缘推理,这个优化值得关注。速度提升意味着你可以在更便宜的硬件上跑出更好的效果。
3. Computer Use 比结构化 API 贵 45 倍
这条数据挺扎心的。
Reflex 团队做了一个详细的成本分析,发现 Anthropic 的 Computer Use 功能(让 AI 直接操作电脑界面)比使用结构化 API 贵了 45 倍。
为啥差这么多?Computer Use 需要不断截图、分析界面、模拟鼠标操作,每一步都要消耗大量 token。而结构化 API 直接返回你需要的数据,中间没有冗余信息。
我觉得这个对比很有意义。很多团队在做 AI Agent 的时候,会倾向于用 Computer Use 来「万能化」解决方案。但如果你的场景有成熟的 API,走结构化路径在成本上完全不是一个量级。
当然,Computer Use 的价值在于它能处理那些没有 API 的场景。关键是你要想清楚,哪些场景值得付出 45 倍的溢价。
4. Anthropic 推出金融行业 AI Agent
Anthropic 昨天发布了面向金融服务和保险行业的 Agent 方案。
这些 Agent 可以处理合规审查、风险分析、客户报告生成等工作。Anthropic 强调了安全性和可审计性,这在金融行业是刚需。
说实话,我看到这条新闻的第一反应是,金融行业可能是 AI Agent 最容易落地的领域之一。原因很简单,金融行业的工作流高度标准化,数据结构化程度高,而且有大量的重复性审查工作。
但同时,金融行业的监管也是最严格的。Anthropic 选择在这个时间点推出金融 Agent,说明他们对模型的安全性和可控性已经有了相当的信心。
5. GLM-5V-Turbo,智谱发布多模态 Agent 基础模型
智谱 AI 在 arXiv 上发了一篇论文,介绍了 GLM-5V-Turbo,一个面向多模态 Agent 的基础模型。
这个模型的核心卖点是「原生多模态」,不是在语言模型上套一个视觉编码器那种做法,而是从预训练阶段就融合了视觉和语言能力。论文里提到,这种架构在 GUI 操作、网页理解等 Agent 场景上有明显优势。
国内大模型厂商在 Agent 方向的投入越来越重了。智谱这一步走得很明确,直接瞄准了「让模型能操作电脑」这个赛道。
6. Meta 版权诉讼升级,扎克伯格被指「亲自授权」侵权
美国出版商在对 Meta 的 AI 版权诉讼中提交了新证据,称扎克伯格「亲自授权并鼓励」了 Meta 使用受版权保护的内容来训练 AI 模型。
这个案子的走向值得关注。如果法院认定 Meta 的行为构成侵权,那整个 AI 行业的训练数据获取方式都要重新审视。现在几乎所有大模型都用了大量的网络数据来训练,版权问题一直是个灰色地带。
怎么说呢,这场官司的结果可能会成为 AI 行业的一个分水岭。
7. Coinbase 裁员 14%,科技圈又一波
Coinbase CEO Brian Armstrong 宣布裁员约 14%。他在公开信里说这是为了「精简运营」。
这不是个案。最近几个月,科技公司的裁员消息此起彼伏。有意思的是,很多公司一边裁人,一边在疯狂招 AI 相关的岗位。
这种「结构性调整」其实挺残酷的。被裁的人未必能力不行,只是公司的战略方向变了。
💡 值得关注
- SubQ,一个支持 1200 万 token 上下文的子二次复杂度 LLM。这个上下文长度已经可以塞进一整本小说了。
- Three Inverse Laws of AI,Susam Pal 写的「AI 三大逆定律」,挺有意思的哲学思考。
- Clipify,一个 Claude Code 技能,可以把长视频自动剪成短视频。自动找有趣的片段、裁切、加字幕。
📝 今日思考
Chrome 偷装 AI 模型这件事,让我想到了一个更深层的问题。
我们正在进入一个「AI 基础设施化」的时代。就像当年操作系统预装浏览器一样,AI 模型正在变成一种默认配置。这对普通用户来说可能是好事,因为不需要自己折腾了。但对那些在意隐私和控制权的人来说,这是一种侵入。
Google 选择静默安装,而不是给用户一个选择的机会,这个决策本身就说明了一些东西。
你觉得呢?你愿意让浏览器在后台跑一个 4GB 的 AI 模型吗?







