导读

本周AI领域迎来一波密集发布,Anthropic和OpenAI正面交锋,各自放出重磅更新。Claude Opus 4.7重新夺回最强通用LLM头衔,OpenAI则用大幅升级的Codex和多模态能力回击。与此同时,AI Agent赛道持续升温,Salesforce、Google等巨头纷纷加码布局。


1. Anthropic发布Claude Opus 4.7,重夺最强LLM桂冠

发布时间:2026-04-16
来源:VentureBeat

Anthropic正式发布了其迄今为止最强大的大语言模型 Claude Opus 4.7。该模型在多项关键基准测试中超越了OpenAI的GPT-5.4和Google的Gemini 3.1 Pro,重新夺回了最强通用大语言模型的地位。

核心亮点

  • GDPVal-AA知识工作评估:以1753的Elo分数领先GPT-5.4(1674)和Gemini 3.1 Pro(1314)
  • 代理编码能力:在agentic coding、scaled tool-use、agentic computer use等场景表现优异
  • 金融分析:在财务分析任务上展现出色表现

不过,竞争依然激烈。在agentic search(代理搜索)领域,GPT-5.4仍以89.3%的得分领先Opus 4.7的79.3%;在多语言问答和原始终端编程方面,竞争对手也保持优势。

点评:Opus 4.7并非”全胜”,而是在企业最看重的可靠性和长程自主性方面做到了专业化领先。这标志着AI模型竞争进入细分赛道阶段。


2. OpenAI大幅升级Codex,可控制电脑所有应用

发布时间:2026-04-16
来源:TechCrunch

OpenAI宣布对其AI编程助手 Codex 进行全面改版,新增多项重磅功能,直接向Anthropic的Claude Code发起挑战。

核心更新

  • 后台运行:Codex现在可以在Mac上后台运行,打开任意桌面应用并执行点击、输入等操作
  • 并行代理:可同时部署多个代理,在不影响用户工作的前提下并行处理任务
  • 生成图像:新增图像生成能力,拓展了应用场景
  • 网页预览:支持实时预览网页效果

OpenAI将Codex定位为”编程伙伴”,可处理辅助性任务,让用户专注于核心项目。典型用例包括前端迭代、应用测试、以及在没有API的应用中工作。

点评:OpenAI正在将Codex从单纯的代码补全工具,转型为真正的AI Agent。与Claude Code的竞争将加速AI编程工具的进化。


3. OpenAI发布GPT-Rosalind,专攻生命科学领域

发布时间:2026-04-16
来源:VentureBeat

OpenAI推出了专门面向生命科学研究的模型 GPT-Rosalind(以DNA结构发现者Rosalind Franklin命名),标志着AI模型向垂直领域深度渗透。

模型定位

  • 专业领域:基因组学、蛋白质工程、化学合成
  • 核心能力:证据综合、生物假设生成、实验规划
  • 与传统GPT的区别:从通用助手转型为领域专属的”推理伙伴”

基准测试表现

  • BixBench(生物信息学数据分析):达到已发布模型的领先水平
  • LABBench2:在11项任务中的6项超越GPT-5.4
  • CloningQA(分子克隆试剂端到端设计):表现尤为突出

OpenAI与Dyno Therapeutics的合作评估显示,该模型在未发表的专有数据集上也展现出强劲潜力。

点评:AI模型正在从”通才”向”专才”演进。生命科学研究周期长、成本高,GPT-Rosalind有望加速从实验室到药房的转化过程。


4. Salesforce推出Headless 360,全面拥抱AI Agent

发布时间:2026-04-16
来源:VentureBeat

Salesforce发布了 Headless 360 平台,旨在将其整个产品体系转化为AI Agent的基础设施,让企业能够构建和部署自主运行的AI代理。

平台特点

  • 无头架构:解耦前端与后端,AI Agent可直接调用Salesforce的全部能力
  • 企业级安全:内置权限控制、审计日志、合规保障
  • 生态整合:与Einstein AI、Data Cloud深度集成

Salesforce表示,Headless 360将帮助企业实现从”AI辅助”到”AI自主”的跨越,让AI Agent真正成为企业的数字员工。

点评:Enterprise AI Agent赛道正在升温。Salesforce此举意味着企业软件巨头开始认真布局AI Agent基础设施。


5. AI流量暴增393%,美国零售商迎来新增长点

发布时间:2026-04-16
来源:TechCrunch

最新数据显示,2026年第一季度,AI驱动流量到美国零售商网站增长了393%,且这些流量正在转化为实际收入。

关键发现

  • AI推荐带来的转化率显著高于传统搜索
  • 用户通过AI助手获取购物建议已成为新趋势
  • 零售商开始优化产品信息以适应AI爬虫

这一现象表明,AI正在改变消费者的购物决策路径,从”搜索-浏览-购买”转向”询问AI-直接购买”。

点评:AI电商时代已经到来。对零售商而言,优化AI可发现性(AI Discoverability)将成为新的必修课。


6. Google Gemini推出Mac原生应用

发布时间:2026-04-15/16
来源:The Verge / TechCrunch

Google正式发布了 Gemini Mac原生应用,将其AI助手带入桌面端,与ChatGPT桌面应用展开正面竞争。

应用特性

  • 快捷键唤醒:支持全局快捷键快速调用
  • 屏幕感知:可以理解屏幕上的内容并提供上下文帮助
  • 文件处理:支持直接拖拽文件进行AI分析
  • 与Google服务深度整合:Gmail、Docs、Drive无缝连接

此外,Google还推出了 AI Mode 更新,允许用户在Chrome中边浏览边使用AI,试图解决”标签页跳转”问题。

点评:桌面端正在成为AI助手的新战场。Google凭借Chrome和Gemini的双重优势,试图在用户体验上实现弯道超车。


7. Adobe Firefly升级为AI创意助手

发布时间:2026-04-16
来源:TechRepublic / VentureBeat

Adobe宣布将其AI创意工具 Firefly 升级为完整的AI创意助手,可跨Photoshop、Premiere、Illustrator等应用运行。

新功能

  • 自然语言指令:用户可以用自然语言描述创意意图,AI自动执行多步骤操作
  • 跨应用工作流:一个指令可在多个Adobe应用间协调完成任务
  • 品牌一致性:自动确保输出符合品牌规范

Adobe表示,Firefly AI助手的目标是让创意人员专注于创意本身,将繁琐的技术操作交给AI。

点评:创意软件正在经历从”工具”到”协作伙伴”的转变。Adobe此举巩固了其在创意AI领域的领先地位。


总结

本周AI领域的核心主题是 “Agent化”“专业化”

  1. Agent化:OpenAI Codex、Salesforce Headless 360、Adobe Firefly都在向AI Agent方向演进,AI从被动工具转为主动执行者
  2. 专业化:GPT-Rosalind的出现标志着大模型开始向垂直领域深耕,通用能力与专业能力的结合成为新趋势
  3. 商业化:AI流量对零售商的显著贡献证明,AI正在从实验室走向真实的商业价值创造

本文信息综合自VentureBeat、TechCrunch、The Verge等科技媒体,发布日期:2026-04-28