【AI Agent 从入门到精通】第七章：AI Agent 记忆系统：从短期到长期记忆的设计与实现

张开发

• 2026/4/18 5:06:20 • 15 分钟阅读

分享文章

【AI Agent 从入门到精通】第七章：AI Agent 记忆系统：从短期到长期记忆的设计与实现

📌前置说明：本系列共 8 章，建议按顺序阅读。📖系列导航：第一章：AI Agent 是什么？一文讲清楚核心概念与架构第二章：AI Agent 的技术原理：LLM + 规划 + 记忆 + 工具第三章：主流 AI Agent 框架对比：LangChain、AutoGPT、AutoGen、LlamaIndex第四章：动手实现你的第一个 AI Agent（附完整代码）第五章：AI Agent 的工具调用与工具设计第六章：多智能体（Multi-Agent）系统架构详解第八章：AI Agent 项目实战：构建企业级智能助手前言你有没有过这种经历：跟一个 AI 聊了很久，下次打开它，它完全不认识你了？这就是记忆系统缺失的问题。AI Agent 的记忆系统决定了它"能记住多少"和"记得多准"。这一章，我们从短期记忆到长期记忆，从向量数据库到 RAG，把 Agent 的记忆系统彻底讲清楚。一、AI Agent 记忆系统的三层架构┌──────────────────────────────────────────────────────────────┐ │ 长期记忆（Long-term Memory） │ │ ┌──────────────────────────────────────────────────────┐ │ │ │ 工作记忆（Working Memory） │ │ │ │ ┌──────────────────────────────────────────────┐ │ │ │ │ │ 即时感知（Perception） │ │ │ │ │ └──────────────────────────────────────────────┘ │ │ │ └──────────────────────────────────────────────────────┘ │ └──────────────────────────────────────────────────────────────┘ 即时感知 → 当前输入（文字、图像、音频）工作记忆 → 当前会话的上下文（变量、状态、对话历史）长期记忆 → 跨会话积累的知识（偏好、经验、历史交互）1.1 三层记忆对比维度即时感知工作记忆长期记忆存储时长毫秒~秒会话期间永久容量极小中等（受限于上下文窗口）极大检索方式直接获取按需读取向量检索实现技术输入解析消息列表 / 变量字典向量数据库是否持久化否否是二、即时感知（Perception）2.1 什么是即时感知？即时感知是 Agent 对当前输入的即时理解，包括：用户输入的文字内容上传的图片、文档语音的转录文本当前的环境状态（时间、位置、设备信息）class Perception: """即时感知模块""" def __init__(self, user_input: str, attachments: list = None): self.raw_input = user_input self.attachments = attachments or [] self.intent = None self.entities = {} self.timestamp = time.time() def parse(self, llm) - dict: """解析当前输入，提取意图和实体""" prompt = f""" 用户输入：{self.raw_input} 请提取： 1. 用户的核心意图（用一句话概括） 2. 关键实体（人名、地名、时间、数字等） 3. 情感倾向（积极/中性/消极）输出 JSON 格式。 """ result = llm.generate(prompt) parsed = json.loads(result) self.intent = parsed["intent"] self.entities = parsed["entities"] return { "intent": self.intent, "entities": self.entities, "raw": self.raw_input } def add_context(self, context: dict): """添加额外上下文（时间、设备等）""" self.entities.update(context)三、工作记忆（Working Memory）3.1 工作记忆的核心作用工作

更多文章

前端开发 2026/4/18 5:05:20

ROS Noetic下，用URDF和Xacro快速搭建一个可键盘控制的小车模型（保姆级避坑指南）

ROS Noetic实战：用Xacro构建可键盘控制的智能小车模型在机器人开发中，快速验证概念原型的能力往往决定了项目迭代效率。今天我们将基于ROS Noetic，从零构建一个可通过键盘控制的智能小车模型，重点解决URDF到Xacro的升级路径&…

PHP不能直接读取CPU温度传感器，必须通过shell_exec()等调用sensors或cat /sys/class/thermal/等外部命令获取，再解析结果；需注意路径存在性、权限及温度单位换算。PHP 能不能直接读取 CPU 温度传感器不能。PHP 本身没有访问硬件传感器的底层能…

张开发

前端开发 2026/4/18 4:27:34

工业肌肉：05 10 分钟写出你的第一个伺服程序：抓巧克力案例教学

05 10 分钟写出你的第一个伺服程序：抓巧克力案例教学当伺服的力量遇上 PLC 的逻辑，机器就拥有了“动作智慧”。前四篇咱们把三兄弟性格、伺服拆家底、变频黑魔法、三参数灵魂都聊透了，今天终于到“上手干”环节——伺服+PLC手拉手，10分钟教你写出人生第一个“抓巧克力”程…

张开发

【AI Agent 从入门到精通】第七章：AI Agent 记忆系统：从短期到长期记忆的设计与实现

最新文章

STM32H743双FDCAN实战：手把手教你搞定消息RAM分区与过滤表共存（附完整代码）

实现指定目录的自动挂载

Face3D.ai Pro开源镜像实战：MIT协议下企业级3D人脸重建系统搭建

FastAPI + LangChain Agent 从零入门学习笔记

基于cv_resnet101_face-detection_cvpr22papermogface的Java集成实战：SpringBoot服务调用

c++怎么编写多线程安全的跨平台文件日志库_无锁队列与异步IO【附源码】

推荐文章

龙虾白嫖指南，请查收~勘

AI Agent在金融科技领域的应用实践：风控、投顾与合规

Unity3D动画插件DoTween进阶应用与性能优化指南

超表面贝塞尔光束生成系统代码功能深度解析

【5G系列】深入解析NAS层UAC：Access Identity与Access Category的获取机制

Spring with AI (): 搜索扩展——向量数据库与RAG(下)肺

相关文章

别再死记硬背MIPI状态转换图了！用Python脚本模拟单向/双向Data Lane状态机

HuggingFace模型下载终极优化：Autodl服务器上的国内镜像与断点续传技巧

Python EXE逆向解密深度解析：从加密打包到源码还原的完整流程

基于 Python 与 PyQt5 构建的特斯拉行车记录仪视频播放器

别再搞混了！PyTorch里CrossEntropyLoss和NLLLoss到底该用哪个？（附代码对比）

别再为Linux打印机驱动烦恼：foo2zjs开源驱动彻底解决兼容性问题

分享文章

更多文章

ROS Noetic下，用URDF和Xacro快速搭建一个可键盘控制的小车模型（保姆级避坑指南）

如何配置文件描述符限制_limits.conf中Oracle用户配置

SAP FI模块避坑指南：修改已过账凭证文本时，FB03和BAPI FI_DOCUMENT_CHANGE的权限与风险

训练数据来源合法吗？（深度拆解Stable Code、CodeLlama等模型的著作权灰色地带）

DC-DC电源设计：从理论公式到实战选型，电感参数深度解析

从零开始：在IAR环境下配置ZStack 2.5.1a协议栈的完整流程与避坑指南

高效批量卸载解决方案：Bulk Crap Uninstaller深度指南

TI毫米波雷达开发：软件生态全景与实战选型指南

DEDA安全审计：追踪点取证分析与反取证技术研究

别再被空白单元格坑了！用Python openpyxl合并Excel表格时，这个自定义函数帮你保留正确数据

PHP函数如何监控CPU温度传感器_PHP读取核心温度硬件值【详解】

工业肌肉：05 10 分钟写出你的第一个伺服程序：抓巧克力案例教学