AI日报 | 2026年5月11日

菲尔兹奖得主 Timothy Gowers 让 ChatGPT 5.5 Pro 去解数论里的开放性问题，不到一小时，模型把一个指数界限改成了多项式界限。MIT 的研究员认为核心想法「完全具有原创性」。Gowers 说了一句让人后背发凉的话，「未来数学贡献的门槛，将是证明某些事是大语言模型做不到的。」

这不是某个 demo 展示，是菲尔兹奖得主在严肃数学研究中得出的结论。AI 日报的第 674 天，我们从这里开始。

🔥 重点新闻

1. ChatGPT 5.5 Pro 两小时完成「博士级」数学研究

菲尔兹奖得主 Timothy Gowers 做了一个实验，让 ChatGPT 5.5 Pro 尝试解决数论中的开放性问题。结果让人意外，模型在不到一小时内，将一个问题中的指数界限改进为多项式界限。一位 MIT 研究员审阅后认为，核心想法「完全具有原创性」。

坦率的讲，这件事的冲击力不在于 AI 能做数学，而在于评判者的身份。Gowers 不是科技博主，不是 AI 公司的 PR，他是菲尔兹奖得主，数学界最顶级的荣誉获得者。当这样的人说「未来数学贡献的门槛将是证明某些事是 AI 做不到的」，你很难把它当成一句夸张的修辞。

来源，The Decoder

2. Codex 自主完成安全审计，22 小时赚了 16.88 美元

Sam Altman 转发了这个案例。一个用户让 Codex 去赚 5 美元，Codex 自己找了开源安全审计赏金项目，提交了 PR，跟维护者沟通，处理了 GitHub 验证流程，最终工作被合并。22 小时后，用户收到了 16.88 美元。

金额不大，但这件事的意义不在于钱。你想想看，一个 AI Agent 从「接受任务」到「拿到报酬」，中间经历了项目发现、代码审计、PR 提交、人类沟通、流程处理这些环节，全程自主完成。这已经不是「帮你写代码」了，这是「帮你赚钱」。按这个效率推算，月入 500 美元是可以期待的。

来源，@sama

3. 旧版 AI 模型急诊诊断已超越人类医生

一项发表在《科学》上的研究显示，OpenAI 一年前发布的 o1 模型在急诊诊断中正确率达到 67%，而人类医生是 50-55%。尤其在信息有限的早期分诊阶段，AI 的优势最明显。

这里有个细节值得注意，测试用的是「一年前的旧模型」。研究团队特别指出，按 AI 的迭代速度，当前模型可能更强。不过研究也有局限，没有覆盖长期住院数据和影像诊断，AI 能否真正改善患者预后还需要进一步验证。

来源，@kimmonismus

4. DeepSeek 融资 70 亿美元，创始人个人出资 30 亿

DeepSeek 正以 500 亿美元估值进行 70 亿美元融资，创下中国 AI 领域最大单轮融资纪录。更让人意外的是，创始人梁文锋个人出资 30 亿美元，占本轮 40%，同时仍保留公司 90% 的所有权。

这笔钱的主要用途是获取算力，加速 V4.1 等新模型的发布，同时投资企业级产品。从对冲基金里长出来的 AI 公司，用自有资金押注到这个程度，这在 AI 行业里确实少见。

来源，@rohanpaul_ai

5. Anthropic 无补贴登顶 OpenRouter 令牌份额榜首

OpenRouter 的数据显示，Anthropic 在没有任何补贴的情况下，令牌份额排名第一。与此同时，腾讯混元 Hy3 预览版在两周免费期内也拿到了总令牌使用量、代码生成、工具调用三项第一，占据 15.4% 市场份额。

这两条消息放在一起看挺有意思。Anthropic 靠产品力拿第一，腾讯混元靠免费期冲量。市场正在快速分化，用户用脚投票的结果已经很清楚了。

来源，@OpenRouter

6. Redis 创始人用几千行 C 代码把大模型「装进」个人电脑

Redis 创始人 Antirez 开源了专为 DeepSeek V4 Flash 设计的推理引擎 ds4。几千行 C 代码，三项关键技术，不对称 2-bit 量化、KV Cache 移至高速 SSD、Apple Silicon 原生 Metal 优化。最终效果是在 128GB MacBook Pro 上流畅运行 1M 上下文窗口的模型，实测 27 tok/s。

这个项目的气质很「Antirez」。不搞花哨的框架，就是用最朴素的工程手段解决最硬的问题。把原本需要云端 GPU 集群的能力，通过极致优化搬到个人设备上，这才是真正的技术民主化。

来源，@AYi_AInotes

💡 值得关注

OpenCLI 打通微信私域信息流，实现了微信、Telegram、Discord 三大平台的命令行读取。AI Agent 终于能整合个人私密社交数据了，不过微信那边会怎么反应还不好说。来源
SpaceXAI 商标正式提交申请，Elon Musk 把 xAI 并入 SpaceX 的动作从品牌层面落地了。多行星文明加超级智能，两个叙事合到一个实体里。来源
YC CEO 开源了个人 AI 操作系统 GBrain，五个月处理了 20 多本书、自动预习会议，管理超 10 万页结构化知识。Garry Tan 说，未来属于能构建复利系统的建造者。来源
工信部启动 AI 科技伦理审查先导计划，部署四项重点任务，包括细化省级审查制度、建设伦理委员会、构建三级联动治理网络。来源
OpenRouter 推出帕累托代码，免费的编码路由工具。设置 min_coding_score 就能路由到成本最低的合格模型，排名由 Artificial Analysis 提供。来源
Qwen 3.5 和 3.6 系列登陆 SiliconFlow，从 9B 到 397B，MoE 和 Dense 都有，原生多模态。尺寸选择越来越丰富了。来源