AI日报 | 2026年02月05日

今日精选 Top 10

1. 面壁智能开源”Her”级全双工交互模型 MiniCPM-o 4.5

面壁智能开源了 MiniCPM-o 4.5,这是一个仅有 9B 参数却能达到 SOTA 性能的多模态模型。它最大的突破是实现了全双工交互体验——能实时感知环境变化,甚至主动开口打断对话,真正有了”活人味”。

为什么重要: 这是端侧 AI 交互的重大突破。9B 参数意味着它可以在消费级设备上流畅运行,而全双工交互能力打破了传统”一问一答”的机械感,为 AI 助手、智能硬件、车载交互等场景打开了新可能。

🔗 GitHub: OpenBMB/MiniCPM-o


2. 钉钉升级为智能体OS,发布 AI 录音卡

钉钉宣布全面升级为智能体操作系统,从”人适应工具”转向”AI 适应人”。现场还发布了引发关注的 AI 录音卡,企业纷纷签约拥抱 AI 转型。

为什么重要: 这标志着国内协同办公平台正式进入”Agent 时代”。当钉钉这样的国民级应用把 AI 智能体作为业务执行核心,意味着 AI 从”辅助工具”变成了”工作伙伴”,企业数字化转型的底层逻辑正在被重写。

🔗 机器之心报道


3. 智谱 GLM-Image 攻克图像文字渲染难题

智谱 AI 发布 GLM-Image,这是一个开源权重的图像生成器,专门解决图片文字渲染这一长期痛点。采用两阶段方法,在基准测试中击败了竞品。

为什么重要: AI 生图的”文字鬼画符”问题终于被系统性解决。这对于海报设计、品牌视觉、出版物等需要精确文字控制的场景是重大利好,也意味着 AI 设计工具向专业级又迈进了一步。

🔗 DeepLearningAI Twitter


4. CIA 关闭 World Factbook,Simon Willison 抢救存档

CIA 突然宣布关闭运营了 50 多年的 World Factbook,并设置了 302 重定向到关闭公告页,连历史存档也不保留。Simon Willison 紧急将 2020 年存档上传至 GitHub 并启用 Pages 镜像。

为什么重要: 这是对”数字公共文化”的一次沉重打击。World Factbook 自 1997 年起就是互联网的重要基石,它的消失提醒我们:即便是最权威的机构,也可能做出令人费解的文化破坏行为。数据的长期保存和去中心化存档变得前所未有的重要。

🔗 Simon Willison 博客


5. Anthropic 估值飙升至 3500 亿美元

Anthropic 估值已飙升至 3500 亿美元,正在推进员工股权套现计划,同时还在进行新一轮巨额融资。

为什么重要: 这是 AI 人才争夺战白热化的最新注脚。如此高的估值不仅反映了资本市场对 Claude 系列模型的认可,也意味着 Anthropic 必须用真金白银留住核心人才——AGI 竞赛已经进入”烧钱抢人”的深水区。

🔗 AIbase 报道


6. 美团 STAR 模型统一理解与生成架构

美团提出 STAR 模型,采用堆叠自回归创新架构,打破多模态”理解”与”生成”的长期僵局。理解能力不打折的同时还能生图,在 GenEval 测试中拿下 SOTA。

为什么重要: 多模态模型的”统一化”是行业共识,但技术难度极高。STAR 的架构创新意味着工业界终于有望用一个模型同时完成图像理解、生成、编辑等任务,大幅降低部署成本。

🔗 arXiv: 2512.13752


7. Xcode 26.3 集成 Claude Agent SDK 支持 Agentic Coding

苹果 Xcode 26.3 正式支持 Agentic Coding,集成了 Claude Agent SDK。但这引发了隐私担忧——开发者担心代码泄露风险。

为什么重要: 这是主流 IDE 首次深度集成 AI Agent 能力,标志着”AI 写代码”从 Copilot 时代的辅助补全,进化到了 Agent 时代的自主任务执行。争议本身也说明:AI 编程的安全边界正在被重新定义。

🔗 News Hacker 报道


8. 微信严打诱导分享,封禁自家元宝红包

微信严打诱导分享行为,连腾讯自家的元宝红包也被封禁,被迫改为口令模式。微信强调用户体验第一,平台规则对谁都一视同仁。

为什么重要: 这体现了微信作为超级平台的底线思维——即便是自家兄弟,也不能破坏用户体验。对于 AI 产品的推广来说,这意味着”裂变式增长”的红利期正在结束,产品本身的价值才是关键。

🔗 AIbase 报道


9. 生成式模型自动进化数据增强策略

新研究利用生成式模型自动进化出最优数据增强策略,突破了传统旋转、裁剪等手工设计的局限。即使数据量极少,效果也惊人。

为什么重要: 数据增强是模型训练的基础环节,但长期依赖人工经验。让 AI 自己设计增强策略,意味着模型训练正在从”人工调参”走向”自动机器学习”的新阶段。

🔗 arXiv: 2602.03123


10. Spiral RoPE:突破视觉 Transformer 方向限制

研究者提出 Spiral RoPE,在 2D 平面旋转位置编码,突破了传统轴向编码的方向限制,能捕捉自然图像中的倾斜关系。

为什么重要: 位置编码是 Transformer 的核心组件,这个改进虽小但意义深远——它让视觉模型能更自然地”看懂”倾斜、旋转的物体,对于自动驾驶、医学影像等场景尤为重要。

🔗 arXiv: 2602.03227


一句话总结

今天 AI 界的关键词是”落地”: 从面壁的端侧交互模型到钉钉的智能体 OS,从美团的统一架构到 Xcode 的 Agentic Coding——AI 正在从实验室走向生产环境,从炫酷演示变成基础设施。


参考来源

产品与发布

行业动态

前沿研究

聚合资讯


本文基于 2026 年 02 月 05 日的 AI 行业动态撰写,引用来源截至发文时均为公开可验证信息。