Daily AI News
AI News|2026-06-16
今日目录
- Codex 开始把设定目标本身交给 agent
- Subagent 的价值开始从概念变成仓库并行设计问题
- Skill 不是写出来的,是从真实操作里压出来的
- 企业 AI 的护城河开始从模型选择转向 learning loop
- 模型可撤回风险,正在把 open weights 从理想变成企业选项
今日判断
我今天更关注两类信息:一类是在讲 agent 到底怎么落地,另一类是在讲企业到底该把什么当成自己的护城河。前者里,最有用的不是再说一句 agent 会替代谁,而是像 Thibault、Swyx、Zara 这种人,直接把机制摊开:让 agent 自己设定可执行 goal、把仓库和任务拆到适合并行 fanout、先把一件事做顺再把过程封装成 skill。这些都不是宏大判断,而是会直接影响你下周怎么改工作流、怎么组织代码、怎么写提示和工具接口的东西。
我看下来,一个很清楚的变化是,builder 开始默认接受 agent 不是单次问答,而是持续循环、拆分、回收经验的系统。Codex 的 /goal 视角,和 subagent 的并行执行,说明产品形态正在从 prompt UI 走向任务操作系统;Zara 那条关于 skill 不是写出来而是做出来的提醒,也很对,因为现在很多团队还在凭空设计 workflow,却没有把真实失败、返工、边界条件沉淀进去。没有这层反馈,所谓 skill 库最后只会变成提示词墓地。
另一边,企业层面的判断也开始收敛:模型本身越来越像可替换层,真正难迁移的是学习回路和数据控制权。Aaron Levie 提到 learning loop 和 open weights,我基本同意,但我更在意它落到工程上的含义:你要不要把人工修正、审批记录、任务结果、知识资产,以后续模型可复用的形式存下来;你要不要接受关键能力依赖单一闭源模型的供应风险。对一线 builder 来说,今天更具体的判断不是选哪家模型,而是先把自己的 loop 和可迁移架构搭起来,不然模型每进步一轮,你都只能重新开始。
快讯
1. Codex 开始把设定目标本身交给 agent
查看原文 · 来源:Thibault Sottiaux (@thsottiaux)
Thibault 说 Codex 现在可以看见并设置自己的 /goal,团队做的很多能力也会同时作为 agent 的工具使用。他把这件事描述成 meta prompting 的泛化:用户先给意图,agent 再把它转成可执行任务。我觉得这条很重要,因为它不是一句抽象愿景,而是在改 coding agent 的控制面。以前用户要自己写清楚任务边界,现在产品开始把任务定义也系统化,这会直接影响 agent 的自主性、可观测性和出错方式。我的判断是,接下来好用的 agent 产品,差异不会只在模型,而在 goal 分解、状态管理和工具暴露层。
2. Subagent 的价值开始从概念变成仓库并行设计问题
查看原文 · 来源:Swyx (@swyx)
Swyx 说他还没看到很多人真正把 Anthropic 的 ultracode 用到位,问题不在模型会不会写,而在仓库和任务是否适合并行 fanout。他的原话很实在:这东西很会烧 token,但如果 repo 没有按并行执行来组织,你就吃不到 subagent 的收益。我更看重这条里的工程含义:subagent 不是多开几个线程这么简单,而是要求代码结构、任务依赖和上下文装配都能拆。我的判断是,未来一段时间真正把 coding agent 用出 10 倍效果的团队,先赢在 repo 结构和任务图,而不是 prompt 技巧。
3. Skill 不是写出来的,是从真实操作里压出来的
查看原文 · 来源:Zara Zhang (@zarazhangrui)
Zara 这条很短,但我觉得比很多长帖更有用:你不是通过写一个 skill 来得到好 skill,而是先把事情做完、修二十次,再让 AI 把你刚才的做法装瓶。这里其实点破了现在很多 agent 产品的一个误区:团队忙着做 skill marketplace、模板库、工作流编辑器,却没有先跑通真实任务,也没有把失败修正过程记录下来。没有这些素材,抽出来的只会是脆弱模板。我的判断是,skill 的上游应该是操作日志、人工修订和例外处理,而不是空白画布上的“设计”。
4. 企业 AI 的护城河开始从模型选择转向 learning loop
查看原文 · 来源:Aaron Levie (@levie)
Aaron Levie 转发并强调一个判断:真正的机会不在挑到最强模型,而在模型之上建立会持续复利的 learning loop,让人的经验和 token 一起积累,而且企业还能保住自己的 IP。这个说法之所以值得看,不是因为它新鲜,而是它已经越来越接近企业 AI 系统的实际设计要求:数据要能沉淀,反馈要能回流,模型要能替换。我的判断是,这会推动更多团队从“接一个模型做个 copilot”转向“搭一层公司自己的 agent runtime 和 memory system”,因为后者才会随着使用越滚越厚。
5. 模型可撤回风险,正在把 open weights 从理想变成企业选项
查看原文 · 来源:Aaron Levie (@levie)
Aaron Levie 说,最近出现的模型被撤回先例,让一个原本偏理论的问题变成现实风险:如果某个国家或企业依赖的模型可以随时不可用,那它就会被迫寻找替代路径,而 open weights 很可能成为最现实的选择。我觉得这条有价值,是因为它把 open weights 从意识形态争论拉回了供应链管理。对 builder 来说,这会影响的不只是模型偏好,而是你要不要做多模型适配、要不要把核心流程做成可迁移、要不要把关键能力压在单一 API 上。我的判断是,未来半年 open weights 的讨论会更少围绕性能榜,更多围绕可控性和可持续交付。
Daily AI News
Subscribe to AI News
Daily AI signal for builders: tools, agents, models, infra, product shifts, and the links behind each event.
No spam. Every issue links back to the original sources.