Vercel 开源 Agent 框架 Eve、Omnigent 智能体团队元框架发布

2026-06-18

AI 编程工具日报 — 2026-06-18

AI 编程工具 / Agent 框架爆发的一期。Vercel 带来了最「文件系统优先」的 Agent 框架,NVIDIA 首次让 Codex 智能体在物理世界自主做实验,Databricks 开源了可以同时调度 Claude Code / Codex / Cursor 的元框架,Google 则在标准化 Agent 发现和验证协议。辅以微软 Copilot 接入 DeepSeek、国产 AI 芯片涨价两条行业动态。


1. Vercel 发布 Eve:开源生产级 AI Agent 框架,每个 Agent 就是一个目录

Vercel 正式开源了其内部使用的 AI Agent 框架 Eve(npm 包,Apache-2.0)。它的核心设计哲学是 filesystem-first:创建一个 Agent 就是创建一个目录,目录结构直接映射 Agent 的全部能力。

一个最小可运行的 Agent 只需要两个文件:agent.ts(声明模型和运行时配置)和 instructions.md(系统提示词,即 Agent 身份)。添加工具、技能、频道、定时任务——都是在目录里加一个文件,Eve 在构建时自动发现和注入,零注册代码。

内置六大生产级能力: 持久化工作流(每步 checkpoint,崩溃可恢复)、每 Agent 沙箱、审批逻辑(needsApproval 字段)、多频道适配器(Slack / Discord / Teams / HTTP 等)、OpenTelemetry 追踪与评估、一键 vercel deploy

Vercel 内部已有 100+ 生产 Agent 运行在 Eve 上,包括数据分析工具 d0(月处理超 3 万查询)、销售代理 Lead Agent(年费约 $5000,ROI 32 倍)和客服 Agent Vertex(自主解决 92% 工单)。

📍 来源: Vercel 官方博客 | GitHub

点评: Eve 不是又一个 Agent 框架——它是 Vercel 用了一年多、跑了上百个生产 Agent 后提炼出来的产物。目录即 Agent 的设计思路很妙,大幅降低了上手门槛。加上 Vercel 的平台效应(部署即 vercel deploy),它可能是目前从开发到生产链路最完整的 Agent 框架。


2. Omnigent 开源:一个会话里同时跑 Claude Code、Codex、Cursor

Databricks 开源了内部使用的 Agent 元框架 Omnigent。它的定位很明确:编程的未来不是一个 Agent,而是一整支 AI 团队。

Omnigent 让你在一个实时会话中同时运行多个 Agent 成员:Claude Code、Codex、Cursor、Pi,以及你自己写的 Agent。它像一个 Agent 调度器,统一管理不同 Agent 的上下文、输出和状态。

该项目由传奇人物 Matei Zaharia(Apache Spark 创始人、Databricks 联合创始人)和 Databricks AI 团队打造。Matei 本人仍然大量写代码,包括 Omnigent 的前端。

📍 来源: X / Yuchen Jin

点评: 各家 Agent 各有所长——Claude Code 长于复杂推理,Codex 适合工程化执行,Cursor 有 IDE 原生体验。Omnigent 的思路是「不做选择,全都要」。这种元框架的玩法值得关注:当 Agent 工具越来越多,调度层本身就是关键基础设施。


3. NVIDIA GEAR 实验室发布 ENPIRE:8 个 Codex 智能体自主做物理实验

NVIDIA GEAR 实验室(Jim Fan 团队)首次实现了 AI 智能体在物理世界的自主研究(AutoResearch)。系统名为 ENPIRE,由 8 个 Codex 智能体 控制 8 台机器人,配备 GPU 和 token 预算,通宵无人运行。

安全设计: 两层硬件保障——硬运动极限切断(机器人超出安全包络线立即失败并自动复位)和扭矩受限夹爪(避免夹碎物体)。Jim Fan 说「安全比保守更保守,人类才能安心睡觉」。

奖励机制: 先收集成功/失败演示 → 让 Agent 用计算机视觉工具写分类器 → 反复优化直到分类器可靠 → 冻结奖励函数。Agent 不能自改 reward,杜绝 gaming 行为。

系统遥测: 定义 MRU(机器人利用率)、MTU(token 利用率)、GPU 利用率三个指标。评估标准为 Tokens-to-Success(完成目标消耗的 token)和 Time-to-Success(完成目标的时间)。

ENPIRE 已自主完成扎带整理、精密针头安装、GPU 插入等高精度任务,发现 8 机器人并行探索显著更快。系统将开源。

📍 来源: X / Jim Fan

点评: 这是 Agent 从「纯数字世界」走向「物理世界」的一次标志性演示。Codex 写代码控制机器人,GPU 做推理,token 做「思考」——系统架构和人类科研团队的实验流程已经高度相似。安全设计尤其值得所有 Agent 开发者参考。


4. Google 发布 Agentic Resource Discovery(ARD)开放规范

Google 联合多家合作伙伴发布了 Agentic Resource Discovery(ARD) 开放规范,旨在让 AI Agent 能够跨组织、跨平台地发现、验证和连接工具、技能和其他 Agent。

两个基础原语:
- Catalog:组织在自己的域名下托管 ai-catalog.json,描述其提供的 AI 能力
- Registry:联邦式搜索引擎,索引多个 Catalog,响应 Agent 的发现请求

加密验证:Agent 在连接前可验证发布者身份,确认能力可靠,再通过原生协议调用。

Google Cloud 的 Agent Registry(Gemini Enterprise Agent Platform 的一部分)已提供企业级支持,包括 URN 命名、出站策略、资源固定和基于 Agent Identity 的信任验证。

规范已发布在 GitHub(Apache 2.0),开发者现在就可以托管 ai-catalog.json 使其能力可被 AI Agent 发现。

📍 来源: Google Developers Blog | GitHub 规范

点评: Agent 爆发后,「下一个 Agent 怎么找到我」成了关键问题。ARD 的定位类似于 Web 的 DNS + robots.txt:让 Agent 资源像网页一样可被索引和验证。如果被广泛采用,它将改变 Agent 能力的调配模式——从「手动配置」变成「自动发现」。


5. 微软正考虑接入 DeepSeek 模型赋能 Copilot

据 36 氪报道,微软正在评估将 DeepSeek 模型接入到 Copilot 协同办公工具中。若落地,微软办公生态(Office 365、Teams 等)将获得 DeepSeek 大模型能力的加持。

对 DeepSeek 来说,这是一个巨大的应用场景——微软 Copilot 覆盖数亿办公用户;对行业来说,这意味着大模型商业化的新路径:模型能力通过成熟产品落地,而非仅靠 API 调用。

📍 来源: 36 氪

点评: 微软同时押注 OpenAI 和 DeepSeek 的迹象越来越明显。Copilot 接入 DeepSeek 不仅是技术选择,也是供应链多元化的战略考量——保证议价能力和供应韧性。对开发者来说,这意味着 DeepSeek 在企业级场景的验证又向前走了一大步。


6. 华泰证券:国产 AI 芯片正迎来涨价窗口

华泰证券发布研报指出,国产 AI 芯片正面临涨价窗口。随着大模型训练和推理需求持续增长,以及供应链产能约束,国产 AI 芯片的供需关系趋紧,价格提升压力增大。

这对 AI 编程工具和 Agent 开发者意味着什么?推理成本可能上升,免费 API 额度可能收窄。对于大量依赖国产芯片做推理的 Agent 应用,成本结构将面临重新评估。

📍 来源: 36 氪

点评: 涨价窗口的信号值得 Agent 开发者关注。推理成本是 Agent 应用的核心经济指标,芯片涨价最终会传导到 API 定价。现在是优化 token 使用效率、评估模型替代方案的窗口期。


本期日报共收录 6 条资讯,覆盖 AI 编程工具框架、Agent 物理世界应用、Agent 发现协议、模型动态和行业趋势。