【AI Agent 从入门到精通】第七章:AI Agent 记忆系统:从短期到长期记忆的设计与实现

张开发
2026/4/18 5:06:20 15 分钟阅读

分享文章

【AI Agent 从入门到精通】第七章:AI Agent 记忆系统:从短期到长期记忆的设计与实现
📌前置说明:本系列共 8 章,建议按顺序阅读。📖系列导航:第一章:AI Agent 是什么?一文讲清楚核心概念与架构第二章:AI Agent 的技术原理:LLM + 规划 + 记忆 + 工具第三章:主流 AI Agent 框架对比:LangChain、AutoGPT、AutoGen、LlamaIndex第四章:动手实现你的第一个 AI Agent(附完整代码)第五章:AI Agent 的工具调用与工具设计第六章:多智能体(Multi-Agent)系统架构详解第八章:AI Agent 项目实战:构建企业级智能助手前言你有没有过这种经历:跟一个 AI 聊了很久,下次打开它,它完全不认识你了?这就是记忆系统缺失的问题。AI Agent 的记忆系统决定了它"能记住多少"和"记得多准"。这一章,我们从短期记忆到长期记忆,从向量数据库到 RAG,把 Agent 的记忆系统彻底讲清楚。一、AI Agent 记忆系统的三层架构┌──────────────────────────────────────────────────────────────┐ │ 长期记忆(Long-term Memory) │ │ ┌──────────────────────────────────────────────────────┐ │ │ │ 工作记忆(Working Memory) │ │ │ │ ┌──────────────────────────────────────────────┐ │ │ │ │ │ 即时感知(Perception) │ │ │ │ │ └──────────────────────────────────────────────┘ │ │ │ └──────────────────────────────────────────────────────┘ │ └──────────────────────────────────────────────────────────────┘ 即时感知 → 当前输入(文字、图像、音频) 工作记忆 → 当前会话的上下文(变量、状态、对话历史) 长期记忆 → 跨会话积累的知识(偏好、经验、历史交互)1.1 三层记忆对比维度即时感知工作记忆长期记忆存储时长毫秒~秒会话期间永久容量极小中等(受限于上下文窗口)极大检索方式直接获取按需读取向量检索实现技术输入解析消息列表 / 变量字典向量数据库是否持久化否否是二、即时感知(Perception)2.1 什么是即时感知?即时感知是 Agent 对当前输入的即时理解,包括:用户输入的文字内容上传的图片、文档语音的转录文本当前的环境状态(时间、位置、设备信息)class Perception: """即时感知模块""" def __init__(self, user_input: str, attachments: list = None): self.raw_input = user_input self.attachments = attachments or [] self.intent = None self.entities = {} self.timestamp = time.time() def parse(self, llm) - dict: """解析当前输入,提取意图和实体""" prompt = f""" 用户输入:{self.raw_input} 请提取: 1. 用户的核心意图(用一句话概括) 2. 关键实体(人名、地名、时间、数字等) 3. 情感倾向(积极/中性/消极) 输出 JSON 格式。 """ result = llm.generate(prompt) parsed = json.loads(result) self.intent = parsed["intent"] self.entities = parsed["entities"] return { "intent": self.intent, "entities": self.entities, "raw": self.raw_input } def add_context(self, context: dict): """添加额外上下文(时间、设备等)""" self.entities.update(context)三、工作记忆(Working Memory)3.1 工作记忆的核心作用工作

更多文章