M-RAG:让你的RAG更快、更强、更高效

张开发
2026/4/14 16:04:58 15 分钟阅读

分享文章

M-RAG:让你的RAG更快、更强、更高效
Retrieval-Augmented Generation (RAG) 通过引入外部知识缓解了大语言模型(LLM)的知识局限和幻觉问题已成为提升模型可靠性的主流范式。然而传统RAG系统严重依赖**文本分块Text Chunking**策略来构建检索单元这带来了固有的结构性缺陷。Figure 1: 分块导致的信息碎片化和结构丢失如图1所示分块过程如同用剪刀裁剪文档会打断原始文档的语义链Semantic Chains导致三种关键问题**信息碎片化Fragmentation**破坏了语义连贯性**噪声引入Noise Introduction**增加了无关内容**全局上下文丢失Loss of Global Context**削弱了文档级推理能力。虽然长上下文LLM的出现让直接处理完整文档成为可能但这并不能解决相关性过滤和证据优先排序的核心需求。为此本文提出M-RAG一种无分块CHUNK-FREE的检索新范式。方案键值解耦的元标记检索Figure 2: M-RAG整体架构M-RAG的核心创新在于键值解耦K-V Decomposition设计。如图2所示系统首先通过Marker Extractor从完整文档中提取结构化的元标记Meta-markers每个标记 被显式分解为两个互补组件检索键k轻量级语义锚点约19-20 tokens针对查询意图优化作为高效的锚点用于相似度匹配信息值v上下文丰富的内容块约50-65 tokens保留完整的事实关系用于生成Table 1展示了标记提取的Prompt设计原则。系统要求LLM生成细粒度的标记每个标记严格覆盖1-3个段落优选1-2个并通过段落重叠确保完整覆盖。提取过程采用零样本或少样本提示无需任务特定训练。组件设计要求k (检索键)生成一个详细问题既总结内容又作为检索查询包含关键实体和概念v (信息值)200-300字自包含段落聚焦单一事实消除代词歧义绑定具体属性paragraph_indices最多3个段落索引0-2个为最佳必须重复使用段落以确保全覆盖检索阶段系统仅在轻量级的k上进行相似度计算采用HNSW算法再根据token预算动态选取对应的v进行生成。这种设计实现了检索效率与生成质量的彻底解耦查询匹配在紧凑的语义空间完成而生成仍能获得完整的上下文支持。效率与效果的双重提升实验在LongBench的NarrativeQA、Qasper和2WikiMultihopQA任务上进行。如Table 2所示M-RAG在低token预算128×1下表现尤为突出在Qasper任务上相比Fixed-Size、Semantic和PIC基线分别提升**37.2%**、**9.2%和14.2%**证明了在资源受限场景下的优势。如图4所示M-RAG的平均检索延迟显著低于基于分块的方法在Qasper上仅需214ms而Semantic需要226msPIC需要331ms。这是因为相似度计算仅在轻量级的k上进行避免了长文本块的嵌入计算开销。Figure 4: 检索时间对比进一步分析表明M-RAG实现了**99.8%**以上的文档覆盖率且k与v的token长度比稳定在1:2.5至1:3之间。这种稳定的解耦结构使M-RAG成为传统分块RAG的可扩展、鲁棒替代方案为长上下文环境下的知识检索提供了新的设计思路。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

更多文章