AI日报 | 2026年5月8日

今天信息量炸了。工信部发了 AI 终端分级国标，OpenAI 一口气更新了语音模型和命令行工具，苹果的 AI 耳朵终于有了新消息。我从 50 多条里挑了 10 条值得聊的，咱们开始。

🔥 重点新闻

1. AI 终端智能化分级国标正式出炉

工信部等部门联合发布了《人工智能终端智能化分级》系列国家标准，把 AI 终端从低到高分成了 L1 响应级、L2 工具级、L3 辅助级、L4 协同级四个等级。

首批覆盖手机、电脑、电视、眼镜、汽车座舱、音箱、耳机 7 个品类，小米、华为、荣耀是主要起草单位。

这条的信号意义很大。之前行业里对「AI 手机」「AI 电脑」的定义五花八门，厂商各说各话。现在有了官方分级体系，消费者至少能有个参考标准，不至于被营销话术忽悠。L4 级标准还在修订中，说明监管层也在为更高级别的 AI 终端留空间。

来源, IT之家

2. OpenAI 发布 GPT-Realtime-2 语音模型 + 提示指南

OpenAI 在 API 里上线了 GPT-Realtime-2，号称具备 GPT-5 级别的推理能力，同时发布的还有翻译模型和转录模型。配套的提示指南也出了，覆盖推理强度调整、工具行为设计、不清晰音频处理等场景。

语音交互赛道卷了几年了，真正好用的产品还是不多。这次 OpenAI 直接把推理能力塞进实时语音模型，意图很明显，要让语音 Agent 不只是「听懂话」，而是「会思考」。Grok 语音助手也在同一天发了 Think Fast 1.0，xAI 和 OpenAI 在语音赛道的正面交锋越来越密集了。

来源, OpenAI 官网｜ X @OpenAIDevs

3. 苹果 AI AirPods 进入 DVT 阶段，最快 9 月亮相

苹果内置摄像头的 AirPods 已经进入设计验证测试阶段，左右耳机各配一个低分辨率摄像头，用来捕捉环境视觉信息，支持升级版 Siri 实现视觉问答。外观类似 AirPods Pro 3，但耳机柄因为塞了摄像头变长了。

坦率的讲，这是我今年最期待的苹果硬件之一。把 AI 能力从手机扩展到耳朵上，这个方向比搞个 AR 眼镜务实多了。你想想看，走在路上看到什么东西，直接问 Siri 就能得到回答，这个场景的想象空间非常大。当然，隐私问题是个大坎，苹果内置了数据上传指示灯，算是给用户一个交代。

来源, IT之家

4. Claude v2.1.133 版本更新，同步登陆 Office 全家桶

两个消息放一起说。Claude 发布了 v2.1.133，新增 worktree.baseRef 设置、sandbox 自定义二进制路径、焦点模式优化等，修复了并行会话死锁、权限规则误匹配等一堆问题。同一天，Claude for Excel、PowerPoint、Word 全面上市，Outlook 开放公测。

Office 全家桶的集成是个大动作。Claude 能在四个微软应用间保持连续对话上下文，比如在 Outlook 里分类邮件，切到 Excel 改数据，PowerPoint 图表和 Word 文档自动同步更新。对企业用户来说，这比单独用 Claude 聊天实用得多。

来源, GitHub Releases ｜ Claude Blog

5. OpenAI 开源命令行工具 openai-cli

OpenAI 在 GitHub 上开源了官方 CLI 工具，Apache 2.0 协议，支持 Homebrew 和 Go 安装。核心能力包括调用 Responses API 实现 Agent 工作流、JSON/YAML 结构化输出、单行命令完成图像生成和语音转录。

这是个很实用的工具。之前 OpenAI 只有语言 SDK，想在终端里快速调个 API 还得写脚本。现在一行命令搞定，特别适合自动化流程和服务器环境。配合 Codex 的 Chrome 插件更新（现在支持跨标签页并行运行），OpenAI 的开发者工具链越来越完整了。

来源, X @dotey

6. GitHub 优化 Agentic Workflows 的 Token 效率

GitHub 团队发现，每个 PR 跑一遍 Agent 工作流，Token 成本累积起来很吓人。他们自己监控了生产环境的工作流，找到了效率低下的环节，然后专门建了个 Agent 来优化这件事。

这条对做 CI/CD 自动化的开发者很有参考价值。Agent 在代码审查、PR 管理这些场景里越来越常见，但 Token 成本是个现实问题。GitHub 的做法是「用 Agent 优化 Agent」，这个思路本身就很有意思。

来源, GitHub Blog

💡 值得关注

atomic.chat 多令牌预测，为 LLaMA.cpp 引入多令牌预测技术，在 M5 Max 上让 Gemma 4 26B 生成速度提升 40%，整体快 1.5 倍。本地推理的性能优化一直在进步。链接
Anthropic 捐赠对齐工具 Petri，Petri 3.0 升级后移交非营利组织 Meridian Labs，英国 AI 安全研究所已在用。Anthropic 在 AI 安全领域的投入确实是最认真的。链接
ChatGPT 中文回复频现「我会稳稳地接住你」，WIRED 剖析了原因，主要是翻译错位加 RLHF 强化学习导致的模式坍缩。Claude 和 DeepSeek 新版本也有类似问题。这个现象挺有意思的，说明后训练的「讨好用户」倾向是个行业通病。链接