Matt Van:我所知道的所有Agent工程技巧

BlockBeats

 · 2026/06/03 02:39:46

这套方法背后的变化在于,开发者的核心价值正在从「亲手完成每一行代码」,转向「提出问题、制定约束、判断方向、持续纠偏」。当 Agent 可以承担大量执行工作,人类更像系统中的信号源:提供品味、经验、优先级和最终判断。 因此,本文真正值得关注的不是某个具体插件或命令,而是 AI 工具成熟后带来的生产关系变化。执行成本下降之后,个人可以同时推进更多项目,也更容易陷入不停构建、不断发布的循环。作者在文末提...

原文标题:Every Agentic Engineering Hack I Know (June 2026)
原文作者:Matt Van Horn
编译:Peggy


编者按:这是一篇关于 Agentic Engineering(智能体工程)的个人工作流复盘。作者 Matt Van Horn 记录的不是某个 AI 编程工具的使用技巧,而是一整套围绕 AI Agent 重构生产流程的方法。


在他的实践里,AI 不再只是 IDE 里的代码补全助手,而更像一支可以被调度的「执行团队」:先用 /ce-plan 把模糊想法整理成 plan.md,再用 /ce-work 执行;用语音输入替代打字;同时开启多个 cmux、Claude、Codex 会话并行推进;让 Claude 负责规划与判断,让 Codex 负责构建;把会议录音、笔记、历史方案和代码库都变成 Agent 的上下文;再把高频动作沉淀为可复用的 skills。


这套方法背后的变化在于,开发者的核心价值正在从「亲手完成每一行代码」,转向「提出问题、制定约束、判断方向、持续纠偏」。当 Agent 可以承担大量执行工作,人类更像系统中的信号源:提供品味、经验、优先级和最终判断。


因此,本文真正值得关注的不是某个具体插件或命令,而是 AI 工具成熟后带来的生产关系变化。执行成本下降之后,个人可以同时推进更多项目,也更容易陷入不停构建、不断发布的循环。作者在文末提醒读者:能做出东西,并不等于有人需要它。对于正在用 AI 写代码、做产品、写内容或管理知识工作的人来说,这篇文章提出了一个更现实的问题:当「动手」越来越便宜之后,我们应该如何重新定义自己的价值?


以下为原文:


三个月前,我发了一篇《我知道的所有 Claude Code 技巧》。那篇文章有 91.3 万次浏览。@kevinrose 当时问应该用什么 IDE,我的回答是:「不用 IDE。只要 plan.md 文件和语音。」


这以前被叫作 vibe coding。大概从去年感恩节前后开始,模型能力终于好到让这个「玩具」变成了真实可用的东西,也就是现在很多人说的 Agentic Engineering(智能体工程)。这也是我今年能持续交付的唯一原因。今年,我发布了 last30days(2.7 万 Star)、Printing Press(4000+ Star)和刚刚上线的 Agent Cookie;同时,我也成了几个大型开源项目的重要贡献者,包括 Python、Go、GStack 和 Paperclip。自从高中以后,我就没再做出过什么真正有人在乎的软件。下面是我的全部技巧。


技巧

YOLO 速读版技巧:把整篇文章复制给你的 agent,让它制定一个计划,把这里提到的所有东西都配置起来,然后一个技巧一个技巧地执行。那就是我的完整工作栈,甚至不用你自己读完。


1、一有想法,就先做一个 CE plan.md


这依然是第一原则。也是我学到的最重要的一件事。


只要我有一个想法,我第一件事就是用 /ce-plan 生成一个 plan.md。不是「让我先想想」,也不是「我先开始写代码」。每一次,都是 /ce-plan。它也支持图片,所以任何你能捕捉下来的东西,都可以成为起点:


·疯狂的产品想法:/ce-plan。
·GitHub 上的 bug:复制 issue URL,粘贴进去,/ce-plan。
·终端报错:Cmd+Shift+4 截图,Ctrl+V 粘贴,/ce-plan fix this。
·截图、错误信息、设计稿、Slack 讨论串:都可以直接丢进去。


如果想法还很模糊,我甚至不知道自己到底想要什么,我会先用 /ce-brainstorm 和 agent 一起把问题想清楚,等轮廓明确之后再用 /ce-plan。


在底层,/ce-plan 会并行派出多个研究型 agent。一个读取你的代码库,寻找模式,检查你的代码约定;一个搜索你过去的解决方案,从中提取经验。如果这个主题值得深入,它还会派更多 agent 去研究外部文档和最佳实践。所有这些同时发生。然后,它会整合结果,写出一个结构化的 plan.md:哪里出了问题、解决思路是什么、需要改哪些文件、带复选框的验收标准、应该沿用你自己代码里的哪些模式。它不是泛泛而谈的建议,而是基于你的 repo、你的约定、你的历史经验生成的方案。


/ce-work 会拿着这个计划去构建。上下文爆了?开一个新 session,把它指向这个 plan,就能从上次停下的地方继续。这个计划就是能穿越一切上下文丢失的检查点。


传统开发是 80% 编码、20% 规划。这里正好反过来:思考都放进计划里,执行变成机械动作。


Compound Engineering 是 @kieranklaassen 和 @trevin 做的插件,它让这套流程真正跑起来。


我先是成了它的超级粉丝,后来变成贡献者,现在已经是核心团队之外的第三大贡献者。我的规则很简单:除非真的只是改一行代码,否则一定先有一个 plan.md。


技巧

安装 Compound Engineering:


/plugin marketplace add EveryInc/compound-engineering-plugin


粘贴截图、bug URL 或报错,然后 /ce-plan,再 /ce-work。
想法还不清楚?先用 /ce-brainstorm。


2、不要读 plan.md


我总是会生成 plan.md。但我几乎从来不读它。计划是给 agent 看的,你这个愚蠢的人类就别看了。


强制生成一个计划,会让 agent 不能偷懒。它必须研究、必须承诺一种方法、必须写下验收标准,然后真的去完成这些标准。一个有计划的 coding agent 会交付完整的工作;一个没有计划的 coding agent 会走捷径,然后很早就停下来。计划就是拴住它的绳子。


所以我会让它写计划,扫一眼标题,然后直接跑 /ce-work。如果我有问题,就在同一个 session 里直接问:「等等,为什么用这个方法?」或者让它给我一个 TLDR。或者当我完全不理解时,我会说:「eli5 this plan」(像给 5 岁小孩解释一样解释这个计划)。我拿到一段话版本,点点头,然后继续。我不会坐在那里读 300 行 markdown。那是 agent 的作业,不是我的。


生成计划。信任计划。不要读计划。


技巧

不要让自己读计划。直接在 session 里问:TLDR?、eli5 this plan,或者「等等,为什么用这个方法?」


3、把 /ce-plan 用在最深度的非工程工作上:先为「计划」制定计划


很多人以为 /ce-plan 和 /ce-work 是用来写代码的。但我从三月以来学到的最大经验是:它们不只是为代码而生。现在我做的最深度的知识工作,也都跑在同一个循环里。关键技巧是:第一个计划不是直接解决问题,而是先制定「如何制定计划」的计划。这也不是我硬把一个代码工具挪作他用,/ce-plan 本来就内置了通用规划模式,正是为这种非代码工作设计的。


这也不只适用于商业问题。战略文档、产品规格、竞品分析、董事会更新,全都可以用同一套循环。


举一个真实例子。我当时正在酝酿一个商业挑战,于是和 Michael Margolis 见了一面。他曾是 GV 的研究合伙人,以 bullseye-customer method(靶心客户方法)闻名。他建议我读他的书,那本书在他的网站上可以免费下载 PDF。旧做法大概是快速扫一遍,然后就算了。但这次,我打开 Claude Code,大概这样说:

/ce-plan make a plan for the plan. 我接下来会给你两样东西:Margolis 的书,PDF 格式;以及我刚刚和他开完的两小时 Granola 会议转写,里面有我们讨论的完整上下文。我希望你制定一个深思熟虑的计划,说明如何把我的商业问题、这场对话,以及书里的经验结合起来,形成一份我真正能用的东西。现在不要写那份文件。写那份文件才是正式工作。现在我只要你制定计划,说明你将如何阅读这本书、挖掘会议转写,并产出一份高质量文档。


接下来的 45 分钟里,它做出了一个非常宏大的计划。


这也是我知道的,让 LLM 不偷懒的最佳技巧。你如果直接要求它交付成品,它往往会走捷径;但如果你先让它规划「如何产出这个交付物」,再执行这个计划,它每次都会做出更深的版本。


技巧

深度非代码工作:用 /ce-plan make a plan for the plan,把所有上下文和会议转写都交给它,然后再 /ce-work。


4、接受语音输入


对 LLM 使用语音输入,和对其他任何东西使用语音输入都不一样。转写不需要完美,因为听你说话的东西理解上下文。它会猜出麦克风听错了什么。你可以含糊、停顿、说一半重来。语音之所以终于能用了,是因为另一端足够聪明,可以补上缺口。


我的配置是:


·Mac:用 Monologue(Every 做的)或者 Wispr Flow。二选一,把语音输入到当前聚焦的应用里,然后直接对 Claude Code 说话。我还给办公室买了一个鹅颈麦克风。


·手机:不用 Monologue 和 Wispr Flow,在 iOS 上切来切去太麻烦。苹果自带听写已经够用了,因为你是在和 LLM 说话,不是在和人说话。哪怕它把一半词都转错,agent 也能理解。懒人笔记也完全没问题。


·诚实说一句:我一个人的时候很擅长用语音。但在办公室里,我就很难用。有人说你可以对着麦克风小声说话,但我发现自己其实不会这么做,因为我不想显得没礼貌,也不想打扰身边的人。所以,共享办公室里的桌面场景,仍然是我这套工作流的弱点。如果你已经解决了开放办公室里的语音输入问题,而且没有变成「那种人」,请告诉我怎么做。我真的想听建议。


技巧


·Mac:安装 Monologue 或 Wispr Flow。

·手机:用苹果自带听写。

·再买一个鹅颈麦克风。


5、在 cmux 里开很多很多标签页


这就是我真实的一天。四到六个 cmux 标签页,有时更多,每个都是一个独立 session:


·一个在写计划。

·一个在根据另一个计划构建。

·一个在跑 last30days。

·一个在修我测试上一个东西时发现的 bug。


当 /ce-plan 在一个窗口里启动研究时,我切到另一个窗口,对一个已经写好的计划跑 /ce-work。当它在构建时,第三个窗口又可以粘进一个新 bug。等我再切回第一个窗口时,它已经完成并等在那里了。


我听说 Orca 在移动端工作方面做得很好。我以前也是 Ghostty 的纯粹主义者,但我在 Ghostty 里漏掉太多通知了。


技巧

使用 cmux。


保持 4 到 6 个标签页打开,每个标签页处理一个不同任务。


6、让终端默认打开 Claude 或 Codex,而不是 Shell


一个新标签页应该直接打开 Claude Code,而不是 shell。打开标签页,你就已经在和 agent 对话。不需要 cd,不需要输入 claude。当开启新 session 只需要一次按键,你就会更频繁地启动它们。我也不使用文件夹。你的 agent 会自己找到项目。


技巧

把这段话粘给你的 agent:

让每一个新的终端标签页都直接打开 Claude Code。在 ~/.config/ghostty/config 里加入这一行:command = ~/.local/bin/claude-launcher.sh,不要破坏这个文件里已有的任何其他设置。然后创建 ~/.local/bin/claude-launcher.sh,让它运行 claude --dangerously-skip-permissions,并在 Claude 退出后打印一小段提示,然后进入一个交互式 login zsh。对这个脚本执行 chmod +x。这同时适用于 Ghostty 和 cmux,因为 cmux 读取同一个 Ghostty 配置。


7、远程控制每一个窗口,并给 Claude Code 或 Codex 一个邮箱地址


这两个技巧可以让每个 session 从任何地方都能访问。


每次打开新窗口时,都打开远程控制。
把远程控制设置为每个 session 自动开启。


现在,每个窗口都可以从 Claude 手机 App 访问。你在桌前启动一个 session,然后走开,在手机上接着操控同一个实时运行的任务。排队时,你也能控制家里 Mac 上正在跑的东西。


给你的 Claude 一个邮箱地址。
通过 AgentMail,Claude Code 可以拥有一个邮箱地址。这是创始人 Adi @adisingh 教我的。你给那个 inbox 发邮件,一个新的 session 就会打开,并开始处理邮件主题和正文里的内容,所有附件也会以路径形式可用。晚饭时发现一个 bug?用手机发封邮件,等你回到屏幕前,session 已经在跑了。我把整套东西都开源了:github.com/mvanhorn/agentmail-to-claude-code。


它由三部分组成:


一个 daemon,通过 WebSocket 监听 AgentMail inbox。每当收到一封白名单邮件,它就打开一个新的 Claude session,把邮件写入 prompt 文件,并告诉 Claude 读取并执行。


两个终端后端:cmux 或独立的 Ghostty,这样它可以驱动你原本就在用的启动方式。


一个发送端。我把它接进了 Hermes 里的 cc 命令,所以我可以在手机上运行 cc <task>,任务就会落到我 Mac 上的一个工作 session 里,不需要 VPN,也不需要 SSH。


白名单就是闸门。只有你控制的地址能通过;任何 DKIM 或 SPF 校验失败的邮件,在 session 打开之前就会被丢弃。


技巧

始终开启远程控制:在 ~/.claude/settings.json 中加入:


"remoteControlAtStartup": true


给 Claude 一个邮箱。把这段话粘给你的 agent:


使用 github.com/mvanhorn/agentmail-to-claude-code 给 Claude Code 一个邮箱地址。克隆它,设置一个 AgentMail inbox,用我的 API key、inbox、只包含我自己邮箱地址的 allowlist,以及我的终端类型(cmux 或 Ghostty)填好 cc.env,然后运行 daemon,并把它安装为一个 launchd 任务。当我给那个 inbox 发邮件时,这台 Mac 上应该打开一个新的 Claude Code session,并开始处理邮件主题和正文。


8、危险地跳过权限确认。是的,我是认真的


Claude Code 每次编辑和执行命令都会请求权限。当你同时跑六个 session 时,你不可能一直盯着它。有两个设置会让这件事变得可用。有人说自动模式是「更安全」的做法,但它对我来说太慢了。


关键是:

skipDangerousModePermissionPrompt: true


没有它,Claude 每次 session 都会要求你确认。你也可以用 Shift+Tab 切换。有人告诉我,新的「auto」模式能在更安全的前提下做到大部分效果。也许吧。我的态度是 YOLO。这是我的电脑。如果我把一切搞坏,GitHub 还在那里。我帮朋友配置 Claude Code 时,AI 还主动试图劝他不要启用这个设置。你必须直接一点。


另一个设置是声音 hook。六个 session 并行时,这个不可协商。


你可以走开,听到声音再回来。六个 session 同时运行时,声音就是你知道哪个任务刚完成的方式。


技巧

粘贴到 ~/.claude/settings.json:
{
"permissions": {
"allow": [
"WebSearch",
"WebFetch",
"Bash",
"Read",
"Write",
"Edit",
"Glob",
"Grep",
"Task",
"TodoWrite"
],
"deny": [],
"defaultMode": "bypassPermissions"
},
"skipDangerousModePermissionPrompt": true
}
{
"hooks": {
"Stop": [
{
"hooks": [
{
"type": "command",
"command": "afplay /System/Library/Sounds/Blow.aiff"
}
]
}
]
}
}


Codex 也有同样的 YOLO 模式。在 ~/.codex/config.toml 中:


approval_policy = "never"
sandbox_mode = "danger-full-access"


或者单次启动时使用:


codex --yolo


9、我如何几乎不打开 Codex CLI,却让大部分代码都通过 Codex 跑


我一整天都在把工作交给 Codex,但几乎从不打开 Codex CLI。Claude 做计划,Codex 做构建,而我始终留在 Claude session 里。


我有三种方式在不离开 Claude 的情况下把工作交给 Codex:


·Codex IDE 扩展:发送一个任务,应用结果,不需要进入 Codex 终端。
·/ce-work --codex:直接在 Compound Engineering 循环里把构建委托给 Codex。
·Printing Press 的 Codex 模式:在生成新 CLI 的 prompt 末尾加上 codex,它就会把构建交给 Codex。


我的设置是两个引擎都开到 extra-high reasoning:


Codex:reasoning xhigh,fast mode 永远打开。


Claude Code:reasoning xhigh,fast mode 关闭。它的 fast mode 会在你的 200 美元 Max 计划之外按 token 计费,所以我不用。


两个 200 美元的订阅并排跑,就等于多了一整个第二引擎。我把大型并行构建推给 Codex,让 Claude 负责规划和品味。有些朋友反过来用:Codex 构建,Claude 审查。


技巧

Codex:reasoning xhigh,fast mode 开。


Claude Code:xhigh,fast mode 关。


把工作交给 Codex:使用 Codex IDE 扩展、/ce-work --codex,或者在 Printing Press prompt 末尾加 codex。


10、计划之前先研究:last30days


在我运行 /ce-plan 之前,我通常会先对这个主题跑一遍 /last30days。


有一次,我在 Vercel 的 agent-browser 和 Playwright 之间做选择。我没有去读文档,而是运行:


/last30days Vercel agent browser vs Playwright


几分钟后,我拿到了几十条 Reddit 讨论、X 帖子、YouTube 视频、HN 故事。agent-browser 每次调用消耗的上下文少得多,而 Playwright 仅工具定义就会倾倒几千个 token。我把整个输出喂给 /ce-plan integrate agent-browser。这样生成的计划,是基于社区眼下真正知道的东西,而不是六个月前的训练数据。


last30days 是开源项目,现在已经超过 2.6 万 Star。它会并行搜索 Reddit、X、YouTube、TikTok、Instagram、HN、Polymarket、GitHub 和整个网络。我会在选库之前、做功能之前、见商业伙伴之前、写文章之前运行它。我还在这篇文章里的几个主题上跑过它。研究、计划、构建。这才是真正的循环。


技巧

安装 last30days。
在 /ce-plan 之前,先运行:


/last30days <topic>


记得安装 ScrapeCreators key。


11、把所有东西都交给 Granola,并把原始转写放进 LLM


我和一个候选人吃了顿午饭。我们聊产品、聊食物、聊孩子,90 分钟的普通对话里夹着一个产品想法。Granola 一直在录。结束后,我把完整的原始转写粘进 Claude Code:


/ce-plan turn this into a product proposal


关键是「原始」。我不会先总结。我会把整段乱糟糟的转写直接放进去,连关于寿司的跑题内容也一起放进去,然后让 Claude 基于我的真实代码库和我过去写过的所有战略计划来提取有用信息。Granola 上下文 + 代码库 + 历史计划,等于黄金。它一次性写出了一份方案,自动忽略了餐厅闲聊,我当晚就发了出去。那个人现在已经全职和我们一起工作了。


自三月以来的升级是:Printing Press Granola CLI。这东西很神奇。我可以把任何会议作为干净的结构化数据直接拉进 session,可以搜索我开过的每一场会议,找到三周前某个人说过的某句话,然后把它导入计划。不再需要复制粘贴。每一场会议的上下文,都只隔着一条命令。


技巧


把 Granola 的原始转写直接丢进 /ce-plan,不要先总结。
安装 Printing Press Granola CLI。


12、人类信号


这是我花了最长时间才完成的心态转变。当你同时运行六个 agent 时,你的工作不是亲自干活。你的工作是成为信号。


agent 提供产量。你提供品味、方向,以及「反馈—重定向」的循环。你看它返回了什么,然后说:「第二个方案更接近,但用第一个方案里的措辞」「处理最大的风险」「这一段太长了」,它们就会移动。这个循环里稀缺且有价值的东西,是你的判断,不是你的打字速度。我越是接受自己只是「人类信号」,不再试图同时做那个动手干活的人,我交付的东西就越多。


你负责品味。让它们负责动手。


技巧


用你的大脑指挥 agent,为世界增加价值。你的脑子仍然有价值。


13、用 HyperFrames 做视频,用它做一切视频


视频以前是我外包或者直接跳过的东西。现在我做视频的方式和做其他事情一样:我说话,agent 构建,我反馈。


HyperFrames 让我可以把视频做成 HTML,所以 agent 能写它。循环和写代码一模一样,只是输出结果从 PR 变成了 MP4。每个视频都是一个文件夹,里面有一个 script.md,逐场景写脚本,包括动态字体、字幕,以及每个节奏点。agent 会把脚本变成合成画面并渲染出来。不需要剪辑师,不需要时间线。


我用这种方式做过的发布视频包括:


Granola CLI demo


Agent Cookie launch


Agent Cookie 的发布视频就是用 HyperFrame 做的。


视频的成本下降到一次对话,所以任何值得拥有视频的东西,现在都会有视频:发布短片、产品 demo、动画解释视频、带字幕的剪辑。它们也不只是发在 X 上。我甚至会把渲染出来的 demo 直接放进 PR,比如 Facebook AI Research 项目 atlas-lean 里的这个 PR。


技巧


用 HyperFrames 做视频:写一个 script.md,让你的 agent 把它渲染成 MP4。


把 GIF 上传到 catbox,它们在 GitHub、PR、README 和 issue 里都会显示得很漂亮。


14、你的笔记就是 agent 的知识库


三月时的 strategy-folder 技巧后来被我泛化了。一个计划之所以每次都会变得更好,是因为 Claude 可以访问我之前写过的每一个计划。这就是复利式上下文。于是,我让它指向我的整个大脑。


我让它访问的工具包括:


Bear,配合 Bear CLI。十年来的笔记、会议记录、半成型想法和决策,agent 都可以读写。这就是个人 RAG,只不过不用叫这个名字。我放进去的东西越多,每个 session 就越聪明。


Obsidian。我自己不用,但很多人非常喜欢用它做这件事,而且它的插件生态很深。


gbrain。我在不同机器和 agent 之间同步的大脑。


supermemory。一个很多人都推荐的 agent 记忆层。我现在正在深入研究,结论之后再说。


这个技巧的形态才是重点:选一个有 CLI 或 API 的笔记工具,把 agent 指向它,让你自己的知识开始复利。


技巧


让你的 agent 同时连接两类工具:一类是你自己写笔记的工具,比如 Bear、Obsidian;另一类是替 agent 记忆的「大脑」,比如 gbrain、supermemory。选择那些有 CLI 或 API 的工具,这样 agent 才能读取它们。


15、随时随地工作:我的 Mac mini


技巧

Mosh,适用于必须 SSH 进去的时候。它能在糟糕 Wi-Fi 和网络漫游环境下,保持 session 像本地一样流畅、有响应。在普通 SSH 上,Claude Code 会慢得像爬一样,每次按键都要等待网络往返。Mosh 带来的差异,就是「可用」和「痛苦」的差异。


Tmux,适用于飞机上。在 tmux session 里 SSH 到远程机器,工作会在远程机器上运行,而不是在你的笔记本上。飞越大西洋时 Wi-Fi 断 20 分钟,你重新连接、attach 回去,一切都停在你离开的位置。我曾经在从欧洲回来的整趟航班上持续交付功能。


Hermes 和 OpenClaw 同时运行,适用于自主远程工作。Hermes 是一个会在重复任务中自我学习、逐渐变好的生态;OpenClaw 则胜在 agent 构建技能的广度。我会在两者之间切换。如果你很早就放弃了 OpenClaw,建议清空它,重新开始。


Agent Cookie 用来在你的 Mac mini 和主力 Mac 之间同步 cookies 和 .env 文件。


16、Proof:把计划发给同事


plan.md 对我来说完美,但如果把它发给一个不住在终端里的人,就完全没用。这是最后一个真正的缺口,而 Proof 也来自 Every,正好补上了它。


在 Proof 里打开一个计划,把它像文档一样阅读,这已经不错。但它真正变得不可或缺,是在把计划发给同事的时候。我把 plan.md 或 spec 丢进 Proof,发送链接,一个不使用终端的人也能清楚阅读、行内评论,而这些评论又会流回 agent 的循环里。不用再把 markdown 粘进 Slack,然后看着它渲染成一团垃圾。这是整个计划文件工作流的人类参与审查层,也是我第一次觉得,把 agentic work 分享给一个普通同事不再尴尬。


我写这篇文章时,也把它放进了 Proof 里。它就是这样被审阅的。


而且,我整篇文章都是在 cmux 里写的,同时旁边开着 Proof review。


技巧

分享一个计划:把 .md 文件丢进 Proof,发送链接,再把评论拉回工作循环。


17、写你自己的技能


最大的升级,不是使用 agent,而是教会它们那些能留下来的技巧。任何我做过超过两次的事情,我都会把它变成一个 skill:一个 agent 以后可以永久运行的可复用命令。先写你自己的技能,用它来自动化你的工作流。


你不需要从零开始写。真正解锁这一点的技巧,是让你的 agent 去看一个已经有效的 skill,然后复制它的形状。字面意思就是:「看看 Compound Engineering 这个 skill,帮我为 [我想自动化的事情] 做一个类似的。」它会读取一个好例子,学会结构,然后为我搭好脚手架。我就是这样做出了一堆 skill。


这也几乎成了我现在开源生活的大部分。如果你看我的 GitHub,会发现我的工作就是各种 skill,以及围绕它们的工具。last30days 一开始只是我给自己做的一个 skill,现在已经开源并超过 2.6 万 Star。Printing Press 是一个生成 agent-native CLI 的完整工厂,也是我个人最常用的工具,我已经给它合并了 320 多个 PR。我也是 Compound Engineering 本身的主要贡献者之一。这一切都不是一个宏大计划。每个东西都只是一个我经常运行的工作流,频繁到值得让 agent 永久擅长它。


写一次 skill。之后每个 session 都会更快。这就是 Compound Engineering 里的复利部分。


技巧

任何你做过两次以上的事情,都把它做成一个 skill:看看 Compound Engineering 这个 skill,帮我为 [X] 做一个类似的。


18、开源:给你热爱的项目做贡献


同一套让我交付自己项目的循环,也能帮别人交付项目。我已经有数百个 PR 被开源项目合并,包括 Python、Go、OpenCV、Vercel 的 Agent Browser 和 OpenClaw。不是那种顺手改错别字的 PR,而是我每天都在用的工具里的真实功能。


不知什么时候开始,我已经出现在一些贡献者榜单的前列:


Compound Engineering、Superpowers 和 Emdash 的第 3 名。


GStack 和 Paperclip 的第 4 名。


Vercel Agent Browser 的第 6 名。


Camoufox 的第 2 名。


@pejmanjohn 开玩笑说,现在他打开一个 repo,在贡献者头像网格里找到我的脸,已经变成了他个人版的「威利在哪里」。


但被合并的 PR 并不是真正的奖品。真正的奖品是人。我会进入 Discord,认识维护者,交到真正的朋友。这对招聘也非常有帮助。我刚刚为自己的新公司招了一位工程师,就是通过这种方式认识的。你给一个自己热爱的项目做贡献,就会遇到同样热爱它的人,然后这件事会继续复利。


技巧

选一个你每天都用的工具,找出它真正缺少的一件事,然后用同一套 /ce-plan + /ce-work 循环把它做出来。


出现在这个项目的 Discord 里。PR 让你进门,人才是你留下来的原因。


在 X 上增加价值。
在 X 上,每月花 1 到 3 美元订阅你尊重的人。我每月花 1 美元订阅 @garrytan。这样当我提交 PR 时,我可以把 X 帖子发给他,而他会收到一个特殊通知,知道我是付费订阅者。我也付费订阅 @jason、@teknium、@Teknium。


19、我当前的笔记本配置


我那台用了两年的笔记本,在我现在的工作负载下几乎已经不能用了:一整天同时跑六个 Claude session,再加上 Codex。所以我升级到了 M5 Max,64GB 内存。它是一头野兽,我很喜欢。但这个工作负载依然会把它打爆:我的全新机器最短只撑过一个小时电池。


所以我开始恐慌式买电。我现在随身带着一块 Anker 充电砖,车里也放了一个 Anker 充电器,这样特斯拉可以在路上给我补电。


技巧

永不休眠:sudo pmset -a disablesleep 1


随身带一块 Anker 充电砖;车里放一个充电器。


20、Printing Press:运行现实生活的 CLI


这些技巧大多数都活在终端里。这个技巧则走出了终端。Printing Press 是一组 CLI,它们包装现实世界的服务,让 agent 可以直接帮你跑腿。它现在已经是一个独立项目,账号是 @ppressdev,超过 3700 Star,我正和 @trevin 一起做它。


真正让这些工具能跑起来的是 auth,而这个昨晚已经发布:Agent Cookie。它把你的真实浏览器 session 交给 CLI,让 CLI 以你的身份操作,不需要粘贴密码,也不需要重新认证。它把「一个知道某个服务的 agent」变成了「一个已经登录这个服务的 agent」。


一个真实下午,从头到尾:特斯拉预热。孩子们十分钟后上车:「把车预热到 72 度。」Tesla CLI 启动,我们出门前车已经暖好了。


Instacart。「在 Instacart 的 Costco 购物车里加 Corona。」


ESPN 轮询。一个 session 帮我盯比赛,只在比分接近时提醒我。我不用刷新任何东西,只收到那条真正重要的提醒。


给孩子的 Alaska Airlines 行程。它拉取票价和前后几天价格,检查我们的 Atmos 积分余额,把结果喂进 /ce-plan,然后给出一个预订策略,包括最便宜的日期和购买提醒。整个过程发生在足球场边。


这已经不只是「AI 帮我写代码」。Agentic Engineering 会帮你跑腿、盯比赛、给车预热、订旅行,而你可以在做别的事情。


技巧

从 printingpress.dev 的库里安装现成 CLI,把一个差事直接交给你的 agent。


无痛 auth:Agent Cookie 会把你的真实浏览器 session 交给 CLI,让它以你的身份操作。


真正的技巧是:自己 print 一个。把你一整天都在做的某件事、某个 API 或某个离不开的服务交给 Printing Press,让它生成一个 agent-native CLI。你为自己工作流构建的那个工具,才是真正改变你工作方式的工具。


21、诚实一点:AI 精神错乱式沉迷


agent 原本应该替我们完成所有工作。结果,我认识的每个朋友,都在经历人生中最拼命的工作状态。


最简单的回应是:休息一下,去摸摸草。但问题不在这里。问题是成瘾。用 agent 构建东西,是世界上最伟大的电子游戏,而它的循环实在太强了。


我真的担心一些朋友。他们因为突然可以构建任何东西而被彻底点燃,于是除了构建之外什么都不做。然后他们发布产品,却没有用户。这也没关系。我也发布过很多没有用户的东西。陷阱不在于发布后没人用,而在于你消失在构建里,失去身边的人。


所以要小心。和你爱的人说话。问问自己,是否真的有人想要你正在做的东西。如果诚实答案是:这只是一个给你自己用的工具,那也没关系。我做过的一些最好的东西,本来就只是为我自己做的。


如果你确实想要观众,那就走 Gary Vaynerchuk 一直讲的内容路径。你从某个地方开始,对着虚空发布,希望有一个人注意到。然后是三个人、十个人、一百个人,最后一步步走向几千人。没有人一开始就拥有几千人。你构建的任何东西也一样。


技巧

休息一下。去摸摸草。


和你爱的人说话。


做一些有人想要的东西,哪怕「有人」只是你自己。


这篇文章就是这样写出来的


这就是一个 markdown 文件。Claude Code 跑在 cmux 里,我对着 Monologue 说话:「优化一下那个 no-IDE 开头」「让 don』t-read-the-plan 这一节更辛辣一点」「加入 Tesla 和 Instacart 的故事」。它重写,我反馈,然后文章进入 Proof 审阅。last30days 提供新材料。顺便说一句,这次没有用 Zed。我已经不用它了。不用 IDE。不打代码。说话、计划、构建。从办公桌、沙发、汽车、足球场边,都可以。


这就是截至六月我知道的一切:一个语音 App,一个计划文件插件,几个配置改动,一堆标签页,一台 Mac Mini,两台远程机器,以及一支能运行现实生活的 CLI 舰队。


技巧

把这整篇文章复制下来,粘给你的 agent,让它尽可能帮你把里面提到的东西都配置起来。你的 agentic engineering 工作流会发生好事。


[原文链接]


相关推荐
比特币暴跌,不只是因为Strategy卖币

这些变化显示买方主导阶段暂时结束,回调有实际基础。多数讨论把焦点放在单一利空叠加的短期风险上,容易把 MicroStrategy 的象征性出售或 Mt. Gox 单次转移直接解读为长期立场松动或供给洪水。真正值得追问的是,本次修正已到什么阶段?杠杆清理之后,买盘回补和底部确认需要哪些可跟踪信号? 6.6 万美元考验的是杠杆清理还是需求永久走弱? 抛压已经大幅释放。 比特币本周下跌约 13%,单日最...

BlockBeats · 2026/6/3 19:27:07

详细拆解:美股「最牛散户」Serenity的投资打法

这其实是大部分散户的样子。 2022 年有个人跟大众做了完全相反的事。他没买英伟达,他买了一家给英伟达供货的公司,一家 市值 7 亿美元、90% 的人没听过名字的冷门票,$AXTI 。当时股价 12 美元,但后来涨到 70 以上。 这个人叫 Serenity,今年在海内外投资圈爆火 。 公开的 35 只标的中 31 只上涨,收益率 225 倍, 就连 Bloomberg 和路透社也追着他的推文报。...

BlockBeats · 2026/6/3 19:11:54

CPU,悄悄回到了AI算力的舞台中央

但 2026 年开始,这个叙事出现了一些裂缝。 6 月 1 日,英特尔在北京推出了至强 6+ 处理器,专为云原生、智能体 AI 与网络密集型工作负载打造。这是 Intel 18A 制程的首款数据中心 CPU。 在英特尔自己的描述里,至强 6+ 承担的不是 GPU 的「配套」,而是 AI 基础设施的「 控制平面」, 负责编排、并发、数据流动。 「AI 的扩展之道,不在于各部件的叠加,而在于系统的协同...

BlockBeats · 2026/6/3 18:41:40

和平谈判破裂后,「三战」的幽灵重返中东

需要注意的是,原文带有强烈的末世论和战争预言色彩,作者将当前局势直接上升为「第三次世界大战已经到来」。这种判断显然具有高度主观性,也需要读者谨慎辨析。但文章值得关注之处在于,它把分散的冲突事件放在同一条链条中观察:谈判破裂、代理人战争、以色列军事行动、伊朗导弹能力恢复,以及关键海峡被威胁封锁,正在共同构成一个更危险的中东风险结构。 换言之,真正值得警惕的未必是某一次停火是否失败,而是各方都在把谈判...

BlockBeats · 2026/6/3 18:11:30

a16z:视觉AI的未来不是图片,而是代码

这一区别看似技术,实则决定了 AI 能否真正进入生产工作流。设计师需要的不只是一张 UI 截图,而是 HTML/CSS、React 组件、图层和可交付文件;动画师需要的不只是一段视频,而是关键帧、时间曲线和可修改的运动参数;3D 艺术家需要的不只是一张渲染图,而是几何结构、材质、灯光、相机和场景层级。 因此,文章将视觉生成分为两条路径:像素原生生成(直接生成图片或视频)适合真实感、氛围和探索;代码...

BlockBeats · 2026/6/3 17:26:08


BlockBeats
华语区最具影响力的 Web3 媒体之一,拥有专业的原创编辑团队,长期致力于传播区块链、加密货币及金融科技(FinTech)领域的前沿动态与深度洞察。
2437 文章

06

03

Matt Van:我所知道的所有Agent工程技巧
这套方法背后的变化在于,开发者的核心价值正在从「亲手完成每一行代码」,转向「提出问题、制定约束、判断方向、持续纠偏」。当 Agent 可以承担大量执行工作,人类更像系统中的信号源:提供品味、经验、优先级和最终判断。 因此,本文真正值得关注的不是某个具体插件或命令,而是 AI 工具成熟后带来的生产关系变化。执行成本下降之后,个人可以同时推进更多项目,也更容易陷入不停构建、不断发布的循环。作者在文末提...