Plan-and-Execute模式：让Agent先规划，再执行

张开发

• 2026/4/21 19:42:28 • 15 分钟阅读

分享文章

上周调试一个多步骤数据解析Agent半夜被报警叫醒——日志里堆满了“Action failed: context exceeded”。Agent试图一次性把整个JSON解析、校验、转换流程塞进单个Prompt结果token爆炸。这种“一杆子捅到底”的写法在简单任务里还能蒙混过关一旦流程复杂立刻现原形。痛定思痛我把架构推倒重来引入了Plan-and-Execute模式。今天我们就聊聊这个让Agent“先想清楚再动手”的实战套路。一、什么是Plan-and-Execute简单说就是把“规划”和“执行”拆成两个阶段。规划器Planner先把任务分解成步骤清单执行器Executor再按清单一步步跑。这听起来像废话——人类不都这么干活吗但很多初学者写Agent时偏偏喜欢把所有步骤揉进一个Prompt里。老项目里常见的反模式是这样的# 别这样写这是典型的“一锅炖”Agentprompt 请执行以下操作 1. 解析用户上传的JSON数据 2. 验证每个字段的类型 3. 转换日期格式为ISO标准 4. 计算数值字段的平均值 5. 生成摘要报告 JSON数据{json_data} 当json_data很大时这个Prompt很容易超长。更糟的是一旦某步出错整个流程全废。二、拆开规划与执行我们重构后的架构长这样classPlanner:defgenerate_plan(self,task_description):# 这里用LLM生成步骤列表实际项目可以加约束条件plan_promptf 请将以下任务分解为可执行的步骤任务{task_description}要求 - 每个步骤应该是原子操作 - 标注步骤间的依赖关系 - 输出格式1. [步骤描述] (依赖[前置步骤编号]) # 调用LLM生成规划returnself.llm(plan_prompt)classExecutor:defexecute_step(self,step,context):# 根据步骤描述选择工具执行toolself.select_tool(step)resulttool.run(context)# 这里可以加重试、回退逻辑returnresult规划器输出的可能长这样1. 解析JSON结构提取字段列表 (依赖无) 2. 验证必填字段是否存在 (依赖1) 3. 转换所有日期字段为ISO格式 (依赖1) 4. 计算数值字段统计量 (依赖1) 5. 生成验证报告 (依赖2,3,4)三、实战踩坑记录坑1规划太抽象初期规划器常输出“处理数据”“分析内容”这种模糊步骤。后来我们在Prompt里加了约束“每个步骤必须对应一个可调用的工具名”。现在步骤描述里必须包含tool:xxx字样。坑2循环依赖某次规划器输出“步骤A依赖步骤B步骤B依赖步骤A”——死循环了。我们在解析依赖关系时加了环路检测现在遇到这种情况会让规划器重新生成。坑三上下文丢失执行器每步只看到当前输入可能忘记之前步骤的结果。我们维护了一个共享的context_dict每步执行后把结果用step_id作为key存进去后续步骤按需读取。# 这是简化后的执行循环context{}forstepinplan:# 把依赖步骤的结果注入当前上下文step_inputself._prepare_input(step,context)resultself.execute_step(step,step_input)context[step.id]result# 存下来给后续步骤用四、进阶技巧动态重规划复杂任务中执行时可能发现规划不合理。我们在每个步骤执行后加了个评估器defshould_replan(current_step,result,context):# 如果结果包含“无法执行”“缺少信息”等关键词# 或者执行时间远超预期# 就触发重规划iferrorinresult.lower():returnTruereturnFalse触发重规划时我们把当前上下文和失败信息喂给规划器让它生成调整后的计划。这个机制救过我们好几次——特别是处理用户临时变更需求时。五、性能权衡Plan-and-Execute模式当然有代价。多轮LLM调用意味着更高的延迟和成本。我们的经验是任务步骤超过3步或者涉及条件分支用这个模式划算简单查询、单步操作直接执行就行可以在规划时让LLM输出“置信度”低置信度的规划可以回退到单步模式另一个优化点缓存常见任务的规划结果。用户经常提交相似任务时没必要每次都重新规划。六、给工程师的几点建议从简单规划器开始先实现固定模板规划比如“解析-验证-转换”三部曲再升级到LLM动态规划。别一上来就搞全自动。给执行器加超时和回退某个步骤卡住时整个Agent不能死等。我们设了默认30秒超时超后尝试替代方案或触发重规划。规划结果要可序列化把生成的计划存到数据库或日志里。出问题时能回溯分析也能用来训练规划评估模型。人工审核环节对于关键业务可以在规划后、执行前插入人工审核。我们系统里高风险操作比如删除数据、调用付费API的规划会挂起等待确认。监控规划质量我们统计了“规划步骤数/实际执行步骤数”的比例发现理想值在0.8-1.2之间。比例过高说明规划太碎过低说明规划漏步骤。这个模式最让我欣赏的一点是它把Agent的“思考过程”外化成了可检查、可调试的规划文本。现在看日志不再是黑盒——我能清楚看到“Agent当时打算怎么做实际执行时在哪步出了问题”。这种可观测性在凌晨三点调试时尤其珍贵。

Plan-and-Execute模式：让Agent先规划，再执行

最新文章

别再只会用现成字体了！手把手教你用FontCreator从零设计一套自己的英文字体

原神模型导入终极指南：GIMI工具让角色自定义变得简单快速

KICS终极解构：AI的“认知公尺”，0.89分即封神，概率范式被判死缓

三步解决Windows系统无法识别iPhone的终极方案：Apple-Mobile-Drivers-Installer深度指南

别再手动装RabbitMQ了！用Docker Compose一键部署带Web管理界面的消息队列

Altium Designer导出Gerber文件保姆级教程（附CAM350/华秋DFM检查避坑指南）

推荐文章

【SAP Basis】从SU01出发：深度解析SAP用户类型与安全策略

3分钟掌握RPG Maker解密技巧：解锁游戏资源宝藏

终极编程语言图标库：50+高清开发标志一键获取

Colmap实战解析：从特征提取到鲁棒匹配的工程化实现

别再手动调音效了！用这5款Unity音频插件，让你的游戏音效瞬间‘活’起来

Ryujinx模拟器终极指南：免费在PC上畅玩Switch游戏的完整教程

相关文章

别再死记硬背MIPI状态转换图了！用Python脚本模拟单向/双向Data Lane状态机

HuggingFace模型下载终极优化：Autodl服务器上的国内镜像与断点续传技巧

Python EXE逆向解密深度解析：从加密打包到源码还原的完整流程

基于 Python 与 PyQt5 构建的特斯拉行车记录仪视频播放器

别再搞混了！PyTorch里CrossEntropyLoss和NLLLoss到底该用哪个？（附代码对比）

别再为Linux打印机驱动烦恼：foo2zjs开源驱动彻底解决兼容性问题

分享文章

更多文章

无人机飞控、平衡车、自稳云台：IMU姿态解算在三个项目里的实战调参心得

老旧系统不能改代码？用脚本+TDE实现数据库凭据动态轮换与配置文件加密

GLM-4.1V-9B-Base真实作品：招聘海报图像→岗位名称+薪资范围+硬性要求提取

OpenClaw定时任务实战：Qwen3-14b_int4_awq每日自动发送天气提醒

实战攻坚：如何利用快马AI为Unity项目生成即插即用的复杂技能系统

Linux相关操作命令

阿里云轻量服务器零基础极速部署、OpenClaw基础配置、钉钉快速接入、阿里云千问/Coding Plan模型配置、新手全流程避坑指南

加拿大VS德国技术移民实测指南：软件测试工程师的精准路线图

计算机毕业设计springboot职工工资管理系统设计与实现基于SpringBoot的企业薪酬核算与发放管理平台 SpringBoot驱动的员工薪资结算与财务管理系统

5B00,5B01,5B02,1700,1701,1702,1704,P07报错佳能全能清零软件

OpenClaw多模态编程助手：Qwen2.5-VL-7B解析代码截图生成注释

Java第六篇：Java抽象类和抽象方法