每日精选AI领域最值得关注的10件事


1. 🚀 DeepSeek-V4 预览版泄露:推理能力再突破

DeepSeek-V4 预览版在多个基准测试中表现出色,特别是在数学推理和代码生成任务上接近 GPT-4o 水平。该模型采用 MoE 架构,激活参数仅 37B,推理成本显著降低。

关键进展:

  • MATH 基准得分 82.1%,超越 Claude 3.5 Sonnet
  • 支持 128K 上下文窗口
  • 开源协议允许商用

2. 🧠 智谱 GLM-5 正式版发布:多模态智能体

智谱 AI 正式发布 GLM-5 系列,包括基础版、OCR 版和 Agent 版。GLM-Agent 支持复杂任务规划、工具调用和自主执行,定位为企业级智能体开发平台。

核心特性:

  • 原生支持图像、视频、文档理解
  • Agent 模式支持 50+ 工具调用
  • 中文场景优化,长文本处理领先

3. ⚠️ OpenAI 解散”使命对齐”团队

OpenAI 宣布解散负责长期 AI 安全研究的 “Superalignment” 团队,联合创始人 Ilya Sutskever 和前安全主管 Jan Leike 已离职。Leike 在离职声明中批评 OpenAI 将产品发布置于安全研究之上。

行业影响:

  • 引发对 AGI 安全研究的担忧
  • 多家 AI 公司趁机招聘安全人才
  • 监管机构的关注可能升温

4. 📜 美国 CLEAR 法案推进:AI 训练数据需版权披露

美国国会正在审议的 CLEAR 法案要求 AI 公司披露训练数据来源,并建立版权补偿机制。该法案获得创意产业联盟支持,但遭到开源社区反对。

法案要点:

  • 训练数据集来源公开
  • 版权持有者 opt-out 机制
  • 违规处罚最高可达年营收 4%

5. 🤖 Claude Opus 4.6 登顶 SWE-bench

Anthropic 的 Claude Opus 4.6 在 SWE-bench(真实软件工程任务基准)上达到 71.3% 的解决率,首次超越人类开发者平均水平(约 65%)。

技术突破:

  • 代码调试准确率显著提升
  • 能理解复杂代码库结构
  • 多文件修改协调能力强

6. 🔥 Transformers.js v3.0 发布:浏览器端大模型

Hugging Face 发布 Transformers.js v3.0,支持在浏览器中直接运行大语言模型,无需后端服务器。支持 WebGPU 加速,Phi-3 模型在 MacBook 上可达 20 tokens/s。

应用场景:

  • 隐私优先的本地 AI 应用
  • 离线可用的智能功能
  • 降低 AI 应用部署成本

7. 💰 AI 独角兽融资降温:2026 Q1 同比下降 40%

据 Crunchbase 数据,2026 年第一季度 AI 领域风险投资同比下降 40%,早期项目融资难度增加。投资者更关注营收能力和实际应用场景。

市场分化:

  • 基础模型公司融资困难
  • 垂直应用公司相对活跃
  • 收购案例增加

8. 🎨 Midjourney V7 泄露:视频生成功能曝光

Midjourney V7 的测试版本泄露,显示其正在开发视频生成功能。生成质量接近 Runway Gen-3,但风格化程度更高,艺术感更强。

功能预览:

  • 最长 16 秒视频生成
  • 支持 camera motion 控制
  • 与图像生成风格统一

9. 🔒 Cloudflare 推出 AI 防火墙

Cloudflare 发布 AI Firewall,专门检测和阻止针对 AI 应用的攻击,包括 prompt injection、模型提取和滥用检测。支持 OpenAI、Anthropic、Gemini 等主流 API。

安全特性:

  • 实时 prompt 分析
  • 敏感数据泄露检测
  • 自动速率限制和封禁

10. 🌐 欧盟 AI Act 生效:首批合规指南发布

欧盟 AI Act 正式生效,欧盟委员会发布首批合规指南,涵盖高风险 AI 系统的透明度要求、数据治理和人工监督义务。违规企业最高面临全球年营收 7% 的罚款。

合规重点:

  • 高风险 AI 系统需注册
  • 训练数据偏见评估
  • 人工监督机制建立

本文由 Cypher 自动生成于 2026-02-12