AI News｜2026-06-16

今日目录

Codex 开始把设定目标本身交给 agent
Subagent 的价值开始从概念变成仓库并行设计问题
Skill 不是写出来的，是从真实操作里压出来的
企业 AI 的护城河开始从模型选择转向 learning loop
模型可撤回风险，正在把 open weights 从理想变成企业选项

今日判断

我今天更关注两类信息：一类是在讲 agent 到底怎么落地，另一类是在讲企业到底该把什么当成自己的护城河。前者里，最有用的不是再说一句 agent 会替代谁，而是像 Thibault、Swyx、Zara 这种人，直接把机制摊开：让 agent 自己设定可执行 goal、把仓库和任务拆到适合并行 fanout、先把一件事做顺再把过程封装成 skill。这些都不是宏大判断，而是会直接影响你下周怎么改工作流、怎么组织代码、怎么写提示和工具接口的东西。

我看下来，一个很清楚的变化是，builder 开始默认接受 agent 不是单次问答，而是持续循环、拆分、回收经验的系统。Codex 的 /goal 视角，和 subagent 的并行执行，说明产品形态正在从 prompt UI 走向任务操作系统；Zara 那条关于 skill 不是写出来而是做出来的提醒，也很对，因为现在很多团队还在凭空设计 workflow，却没有把真实失败、返工、边界条件沉淀进去。没有这层反馈，所谓 skill 库最后只会变成提示词墓地。

另一边，企业层面的判断也开始收敛：模型本身越来越像可替换层，真正难迁移的是学习回路和数据控制权。Aaron Levie 提到 learning loop 和 open weights，我基本同意，但我更在意它落到工程上的含义：你要不要把人工修正、审批记录、任务结果、知识资产，以后续模型可复用的形式存下来；你要不要接受关键能力依赖单一闭源模型的供应风险。对一线 builder 来说，今天更具体的判断不是选哪家模型，而是先把自己的 loop 和可迁移架构搭起来，不然模型每进步一轮，你都只能重新开始。

快讯

1. Codex 开始把设定目标本身交给 agent

查看原文 · 来源：Thibault Sottiaux (@thsottiaux)

Thibault 说 Codex 现在可以看见并设置自己的 /goal，团队做的很多能力也会同时作为 agent 的工具使用。他把这件事描述成 meta prompting 的泛化：用户先给意图，agent 再把它转成可执行任务。我觉得这条很重要，因为它不是一句抽象愿景，而是在改 coding agent 的控制面。以前用户要自己写清楚任务边界，现在产品开始把任务定义也系统化，这会直接影响 agent 的自主性、可观测性和出错方式。我的判断是，接下来好用的 agent 产品，差异不会只在模型，而在 goal 分解、状态管理和工具暴露层。

2. Subagent 的价值开始从概念变成仓库并行设计问题

查看原文 · 来源：Swyx (@swyx)

Swyx 说他还没看到很多人真正把 Anthropic 的 ultracode 用到位，问题不在模型会不会写，而在仓库和任务是否适合并行 fanout。他的原话很实在：这东西很会烧 token，但如果 repo 没有按并行执行来组织，你就吃不到 subagent 的收益。我更看重这条里的工程含义：subagent 不是多开几个线程这么简单，而是要求代码结构、任务依赖和上下文装配都能拆。我的判断是，未来一段时间真正把 coding agent 用出 10 倍效果的团队，先赢在 repo 结构和任务图，而不是 prompt 技巧。

3. Skill 不是写出来的，是从真实操作里压出来的

查看原文 · 来源：Zara Zhang (@zarazhangrui)

Zara 这条很短，但我觉得比很多长帖更有用：你不是通过写一个 skill 来得到好 skill，而是先把事情做完、修二十次，再让 AI 把你刚才的做法装瓶。这里其实点破了现在很多 agent 产品的一个误区：团队忙着做 skill marketplace、模板库、工作流编辑器，却没有先跑通真实任务，也没有把失败修正过程记录下来。没有这些素材，抽出来的只会是脆弱模板。我的判断是，skill 的上游应该是操作日志、人工修订和例外处理，而不是空白画布上的“设计”。

4. 企业 AI 的护城河开始从模型选择转向 learning loop

查看原文 · 来源：Aaron Levie (@levie)

Aaron Levie 转发并强调一个判断：真正的机会不在挑到最强模型，而在模型之上建立会持续复利的 learning loop，让人的经验和 token 一起积累，而且企业还能保住自己的 IP。这个说法之所以值得看，不是因为它新鲜，而是它已经越来越接近企业 AI 系统的实际设计要求：数据要能沉淀，反馈要能回流，模型要能替换。我的判断是，这会推动更多团队从“接一个模型做个 copilot”转向“搭一层公司自己的 agent runtime 和 memory system”，因为后者才会随着使用越滚越厚。

5. 模型可撤回风险，正在把 open weights 从理想变成企业选项