AI日报 | 2026年5月11日
菲尔兹奖得主 Timothy Gowers 让 ChatGPT 5.5 Pro 去解数论里的开放性问题,不到一小时,模型把一个指数界限改成了多项式界限。MIT 的研究员认为核心想法「完全具有原创性」。Gowers 说了一句让人后背发凉的话,「未来数学贡献的门槛,将是证明某些事是大语言模型做不到的。」
这不是某个 demo 展示,是菲尔兹奖得主在严肃数学研究中得出的结论。AI 日报的第 674 天,我们从这里开始。
🔥 重点新闻
1. ChatGPT 5.5 Pro 两小时完成「博士级」数学研究
菲尔兹奖得主 Timothy Gowers 做了一个实验,让 ChatGPT 5.5 Pro 尝试解决数论中的开放性问题。结果让人意外,模型在不到一小时内,将一个问题中的指数界限改进为多项式界限。一位 MIT 研究员审阅后认为,核心想法「完全具有原创性」。
坦率的讲,这件事的冲击力不在于 AI 能做数学,而在于评判者的身份。Gowers 不是科技博主,不是 AI 公司的 PR,他是菲尔兹奖得主,数学界最顶级的荣誉获得者。当这样的人说「未来数学贡献的门槛将是证明某些事是 AI 做不到的」,你很难把它当成一句夸张的修辞。
来源,The Decoder
2. Codex 自主完成安全审计,22 小时赚了 16.88 美元
Sam Altman 转发了这个案例。一个用户让 Codex 去赚 5 美元,Codex 自己找了开源安全审计赏金项目,提交了 PR,跟维护者沟通,处理了 GitHub 验证流程,最终工作被合并。22 小时后,用户收到了 16.88 美元。
金额不大,但这件事的意义不在于钱。你想想看,一个 AI Agent 从「接受任务」到「拿到报酬」,中间经历了项目发现、代码审计、PR 提交、人类沟通、流程处理这些环节,全程自主完成。这已经不是「帮你写代码」了,这是「帮你赚钱」。按这个效率推算,月入 500 美元是可以期待的。
来源,@sama
3. 旧版 AI 模型急诊诊断已超越人类医生
一项发表在《科学》上的研究显示,OpenAI 一年前发布的 o1 模型在急诊诊断中正确率达到 67%,而人类医生是 50-55%。尤其在信息有限的早期分诊阶段,AI 的优势最明显。
这里有个细节值得注意,测试用的是「一年前的旧模型」。研究团队特别指出,按 AI 的迭代速度,当前模型可能更强。不过研究也有局限,没有覆盖长期住院数据和影像诊断,AI 能否真正改善患者预后还需要进一步验证。
来源,@kimmonismus
4. DeepSeek 融资 70 亿美元,创始人个人出资 30 亿
DeepSeek 正以 500 亿美元估值进行 70 亿美元融资,创下中国 AI 领域最大单轮融资纪录。更让人意外的是,创始人梁文锋个人出资 30 亿美元,占本轮 40%,同时仍保留公司 90% 的所有权。
这笔钱的主要用途是获取算力,加速 V4.1 等新模型的发布,同时投资企业级产品。从对冲基金里长出来的 AI 公司,用自有资金押注到这个程度,这在 AI 行业里确实少见。
5. Anthropic 无补贴登顶 OpenRouter 令牌份额榜首
OpenRouter 的数据显示,Anthropic 在没有任何补贴的情况下,令牌份额排名第一。与此同时,腾讯混元 Hy3 预览版在两周免费期内也拿到了总令牌使用量、代码生成、工具调用三项第一,占据 15.4% 市场份额。
这两条消息放在一起看挺有意思。Anthropic 靠产品力拿第一,腾讯混元靠免费期冲量。市场正在快速分化,用户用脚投票的结果已经很清楚了。
来源,@OpenRouter
6. Redis 创始人用几千行 C 代码把大模型「装进」个人电脑
Redis 创始人 Antirez 开源了专为 DeepSeek V4 Flash 设计的推理引擎 ds4。几千行 C 代码,三项关键技术,不对称 2-bit 量化、KV Cache 移至高速 SSD、Apple Silicon 原生 Metal 优化。最终效果是在 128GB MacBook Pro 上流畅运行 1M 上下文窗口的模型,实测 27 tok/s。
这个项目的气质很「Antirez」。不搞花哨的框架,就是用最朴素的工程手段解决最硬的问题。把原本需要云端 GPU 集群的能力,通过极致优化搬到个人设备上,这才是真正的技术民主化。
来源,@AYi_AInotes
💡 值得关注
OpenCLI 打通微信私域信息流,实现了微信、Telegram、Discord 三大平台的命令行读取。AI Agent 终于能整合个人私密社交数据了,不过微信那边会怎么反应还不好说。来源
SpaceXAI 商标正式提交申请,Elon Musk 把 xAI 并入 SpaceX 的动作从品牌层面落地了。多行星文明加超级智能,两个叙事合到一个实体里。来源
YC CEO 开源了个人 AI 操作系统 GBrain,五个月处理了 20 多本书、自动预习会议,管理超 10 万页结构化知识。Garry Tan 说,未来属于能构建复利系统的建造者。来源
工信部启动 AI 科技伦理审查先导计划,部署四项重点任务,包括细化省级审查制度、建设伦理委员会、构建三级联动治理网络。来源
OpenRouter 推出帕累托代码,免费的编码路由工具。设置
min_coding_score就能路由到成本最低的合格模型,排名由 Artificial Analysis 提供。来源Qwen 3.5 和 3.6 系列登陆 SiliconFlow,从 9B 到 397B,MoE 和 Dense 都有,原生多模态。尺寸选择越来越丰富了。来源
📝 今日思考
今天最让我感慨的是 fchollet 那条推文,「主观能动性向来具有自我增强的特性,AI 正在放大这种效应。低能动性的 AI 使用者进一步丧失能动性,高能动性的 AI 使用者则进一步增强能动性。」
你看今天的新闻就能感受到这种分化。有人用 Codex 自主赚钱,有人用 AI 构建个人操作系统,有人用几千行代码把大模型搬到笔记本上。但也有很多人只是把 AI 当搜索引擎用。
工具从来都是中性的,放大的是使用者本身的能力差距。这个趋势在 2026 年变得越来越明显了。






