把AI变成个人执行系统,Claude最新Managed Agents实践手册

BlockBeats

 · 2026/04/09 03:39:16

在这一框架下,常见的使用模式也随之发生变化:从事件触发、定时运行,到「触发即交付」的自动执行,再到跨天甚至跨周的复杂任务,agent 开始真正具备「持续工作」的能力。这意味着,AI 的价值不再只体现在单次回答的质量上,而在于其能否在时间维度上积累与复利。 如果说过去的 API 让开发者「调用智能」,那么 Managed Agents 正在尝试回答另一个问题:如何让智能成为可以被托管、调度并持续运转...

原文标题:Launching Claude Managed Agents
原文作者:Lance Martin
编译:Peggy,BlockBeats


编者按:本文介绍了 Claude 推出的 Managed Agents。它提供了一个更接近未来的软件形态:智能体不再是一次性响应请求的接口,而是可以被配置、部署、调度并长期运行的执行系统。


通过将「智能」(模型与运行框架)、「执行」(工具与沙箱)与「过程」(会话与日志)彻底解耦,Claude Managed Agents 将 agent 从「代码里的逻辑」转变为一种独立的基础设施单元。这种设计不仅提升了系统在长周期任务中的稳定性与安全性,也使 agent 能够随着模型能力的演进而持续扩展,而不被既有框架所束缚。


在这一框架下,常见的使用模式也随之发生变化:从事件触发、定时运行,到「触发即交付」的自动执行,再到跨天甚至跨周的复杂任务,agent 开始真正具备「持续工作」的能力。这意味着,AI 的价值不再只体现在单次回答的质量上,而在于其能否在时间维度上积累与复利。


如果说过去的 API 让开发者「调用智能」,那么 Managed Agents 正在尝试回答另一个问题:如何让智能成为可以被托管、调度并持续运转的系统。在这一意义上,agent 不再只是工具,而更接近一种新的计算原语。


以下为原文:


TL;DR


Claude Managed Agents 是一套预构建、可配置的智能体运行框架(agent harness),运行在托管基础设施之上。你只需将一个智能体定义为模板——包括工具、技能、文件/代码仓库等,其余的运行框架和基础设施都由系统提供。该系统旨在跟上 Claude 快速增长的智能水平,并支持长周期任务。


相关链接如下:

·Claude 博客:使用模式与客户案例

·工程博客:Claude Managed Agents 的设计

·文档:上手指南、快速开始、CLI 与 SDK 概览


Claude Managed Agents


为什么需要 Claude Managed Agents


Claude 的 messages API 本质上是直接与模型交互的入口:输入消息,返回内容块。基于 messages API 构建的智能体,需要依赖一个「运行框架」(harness)来完成工具调用的路由、上下文管理等工作。但这会带来几个问题:


1、运行框架需要不断跟上 Claude 的能力演进
我最近写过一篇博客,介绍如何基于 Claude API 的底层能力来构建智能体,用于处理工具编排和上下文管理。但问题在于,agent 的运行框架通常隐含了一些关于「Claude 做不到什么」的假设。随着 Claude 能力提升,这些假设很快会过时,甚至反过来成为性能瓶颈。因此,运行框架必须持续更新,才能跟上 Claude 的进化速度。


2、Claude 的任务周期正在变得更长
Claude 能处理的任务时间跨度正呈指数级增长,在 METR 基准测试中,已经超过 10 小时的人类工作量。这对智能体的底层基础设施提出了更高要求:必须具备安全性、在长时间运行中的稳定性(应对各种基础设施故障),以及可扩展能力(例如支持多个智能体团队同时运行)。


为什么这些问题重要


解决上述挑战至关重要,因为我们预计,未来的 Claude 将能够在数天、数周甚至数月的时间尺度上,持续运行并处理人类最复杂的问题。


Claude Agent SDK 是这一方向的第一步,它提供了一个通用、易用的智能体运行框架。而 Claude Managed Agents 则是进一步演进:在此基础上,提供了完整的运行框架 + 托管基础设施,专门用于支持在长时间跨度下安全、可靠地执行任务。


如何开始使用


一个简单的入门方式,是使用我们开源的 claude-api skill,它可以在 Claude Code 中开箱即用。你只需安装最新版 Claude Code,然后运行以下子命令,即可完成 Claude Managed Agents 的初始化配置。


我个人对「skills」这种接入新功能的方式非常看好,也在实际中大量使用这个 skill。



此外,你也可以参考我们的文档,通过 SDK 或 CLI 快速上手,并在 Claude Console 中对智能体进行原型开发。


使用场景


你可以在 Claude 官方博客中看到许多有意思的案例。结合这些案例以及我自己的实践,我观察到一些常见的使用模式:


1、事件触发(Event-triggered)
由某个服务触发 Managed Agent 执行任务。
例如,当系统检测到一个 bug 时,会自动调用一个托管智能体来编写修复补丁并提交 PR。在「问题被标记」到「执行修复」之间,不需要人工介入。


2、定时执行(Scheduled)
为 Managed Agent 设置定时任务。
例如,我和很多人都会用这种方式生成每日简报(比如 X 平台或 GitHub 的动态汇总,或者一个智能体团队的工作进展)。下面是我日常使用的一个 X 活动每日简报示例。



3、一次触发、无需跟进(Fire-and-forget)
由人类触发 Managed Agent 执行任务,但过程中无需持续参与。例如,通过 Slack 或 Teams 给托管智能体分配任务,它会自动完成并返回结果(如表格、幻灯片,甚至应用程序)。


4、长周期任务(Long-horizon tasks)
长时间运行的任务,是我认为 Managed Agents 特别有价值的场景之一。
我曾基于 Andrej Karpathy's auto-research repo 做过一些实验,探索不同的应用方式。比如,我最近将 _chenglou's pretext library 作为输入,让一个 Managed Agent 去研究如何将其应用到我们的工程博客内容中。



核心概念


在上手过程中,有三个核心概念需要理解:


1、Agent(智能体)
一个带版本管理的配置,定义了智能体的「身份」:包括模型、system prompt、工具、技能、MCP 服务器等。创建一次后,可以通过 ID 反复调用。


2、Environment(环境)
一个模板,用于描述为智能体工具运行所提供的沙箱环境(例如运行时类型、网络策略、依赖包配置等)。


3、Session(会话)
一次有状态的运行实例,基于预先创建好的 agent 配置和 environment 启动。它会从环境模板中生成一个全新的沙箱,挂载本次运行所需的资源(如文件、GitHub 仓库),并将认证信息安全存储在密钥库中(如 MCP 凭证)。


可以这样理解:


·Agent = 配置本身

·Environment = 智能体运行所需的沙箱模板

·Session = 一次具体执行过程


一个 Agent 可以对应多个 Session。


使用方式


具体可参考文档。整体使用分为两类:


1、SDK(面向代码)
在应用中引入 SDK,在运行时驱动 session。当前已有 6 种语言支持 Managed Agents:Python、TypeScript、Java、Go、Ruby、PHP。


2、CLI(面向终端)
通过命令行操作所有 API 资源,包括 agents、environments、sessions、vaults、skills、files 等,每一类资源都有对应子命令。


常见实践模式:
通常使用 CLI 完成配置与初始化,用 SDK 处理运行时逻辑。
Agent 模板是持久化的——你可以创建一个模板(例如用 YAML 定义模型、system prompt、工具、MCP 服务器、skills),存储在 Git 中,并通过 CLI 在部署流程中应用。


工作原理


我和 @mc_anthropic、@gcemaj、@jkeatn 一起写过一篇 Anthropic 的工程博客,详细介绍了 Claude Managed Agents 的构建过程。文章中一个重要结论是:让智能体能够随着 Claude 智能水平扩展,本质上是一个「基础设施问题」,而不仅仅是运行框架(harness)设计问题。


也就是说,真正的挑战不在于「怎么写一个更聪明的 agent」,而在于如何构建一套能够长期稳定运行、可扩展、可演进的系统,让 agent 能够承载越来越复杂、越来越长期的任务。



基于这一思路,我们并没有去设计一种固定的 agent 运行框架(harness),因为我们预期它会持续演进。相反,我们将系统中的几个关键部分进行了「解耦」:


「大脑」(Claude 及其运行框架)

「双手」(执行具体操作的沙箱与工具)

「会话」(记录执行过程的事件日志)


这三者被设计为相互独立的接口,对彼此的假设尽可能少。每一个部分都可以单独失败、单独替换,而不会影响整体系统。


我们在文中也分享了,这种架构如何带来更高的可靠性、安全性与灵活性——同时也为未来接入新的运行框架、沙箱或承载会话的基础设施预留了空间。


结语


我对那些正在探索多智能体协同(multi-agent orchestration)或长周期任务的项目感到非常兴奋。过去我一直感到困扰的一点是:agent 的运行框架很难跟上模型能力的进化。


而 Claude Managed Agents 的意义在于,它替你处理了运行框架与基础设施层的问题,使你可以把精力放在更高一层——把「agent」本身当作 Claude API 中的一种新的基础原语,在其之上进行更多探索与构建。


[原文链接]


相关推荐
半小时就能搞懂一个新领域,如何用AI快速建立认知框架?

他说怎么感觉啥你都能聊一聊,什么 Harness、什么 Claude Code、什么心理学、什么杀戮尖塔 2、什么克苏鲁神话,你怎么还有时间玩宝可梦 popakia,你到底一天有多少个小时? 我当时就愣了一下。 因为坦率的说,聊天吹牛逼归吹牛逼,我真的没觉得自己什么都懂,我只是对很多东西好奇,然后有一套办法能让我很快地把一个陌生的东西摸个七七八八。 他又问,什么办法? 我说,一个我自己搞的研究框架...

BlockBeats · 2026/4/14 19:14:26

稳定币牌照之争落幕:最焦虑的香港,等不到下一个小马哥

两年后,2026 年 4 月,首批稳定币牌照公布。陈德霖落选了。在这个四月,香港稳定币牌照的落地,被包装成一次金融创新的里程碑。但如果剥开那些关于「拥抱 Web3」的光鲜叙事,你会看到一个完全不同的故事。 借由这张牌照,香港袒露了它在新旧时代交替之际的困境。这座城市曾因其历史而被完美塑造,如今,也正被这段沉甸甸的历史死死困住。 香港稳定币牌照的争夺,更像是一场从一开始就注定结局的「包办婚姻」。共有...

BlockBeats · 2026/4/14 18:36:57

IOSG:TAO就是投了OpenAI的Elon Musk,Subnet就是Sam Altman

剥去叙事外衣,你会发现一些更令人不安的东西。 Bittensor 是一项资助计划,加密货币投机者为人工智能研发提供资金——而受资助者没有义务向 TAO 返还任何价值。 可以把 TAO 想象成埃隆·马斯克——他是 OpenAI 这家「非营利」企业的首位投资人。子网就像山姆·奥特曼——他们是拿到资金的建设者、交付产品,但没有任何合同义务来分享收益。他们最终可能会选择将收益私有化,而不会向最初的资金来源...

BlockBeats · 2026/4/14 18:35:24

除了CZ的新书,还有哪些币圈人士的传记值得一读?

如果你读完 CZ 的新书仍觉得意犹未尽,那么以下这份涵盖「中外视角」的币圈必读书单与深度纪实,绝对能让你看透这个魔幻的十年江湖。 一、西方视角:从极客乌托邦到华尔街的全球叙事 西方视角的传记往往更侧重于技术理想主义的碰撞、合规博弈以及资本市场的疯狂。 1.《Digital Gold》(数字黄金)- 比特币的「创世纪」 核心人物:中本聪、Winklevoss 兄弟、早期极客 看点:如果你想知道这一切...

BlockBeats · 2026/4/14 16:54:11

长达四页的内部信,OpenAI在打什么牌?

80 亿美元的会计差距从哪里来 Anthropic 报出 300 亿美元年化营收,OpenAI 说实际数字是 220 亿。差出来的 80 亿美元,是两家公司在收入记账口径上做出的截然不同的选择。 Anthropic 采用毛口径(Gross)记账:当一家企业通过 AWS 购买了 Claude 的使用额度,Anthropic 把这笔钱的全额计入顶线收入,再把支付给亚马逊的平台分成作为成本处理。Open...

BlockBeats · 2026/4/14 16:38:55

04

09

把AI变成个人执行系统,Claude最新Managed Agents实践手册
在这一框架下,常见的使用模式也随之发生变化:从事件触发、定时运行,到「触发即交付」的自动执行,再到跨天甚至跨周的复杂任务,agent 开始真正具备「持续工作」的能力。这意味着,AI 的价值不再只体现在单次回答的质量上,而在于其能否在时间维度上积累与复利。 如果说过去的 API 让开发者「调用智能」,那么 Managed Agents 正在尝试回答另一个问题:如何让智能成为可以被托管、调度并持续运转...