高级 RAG 技术：查询转换与查询分解

张开发

• 2026/4/14 23:33:27 • 15 分钟阅读

分享文章

检索增强生成RAG的基础流程是用户查询转换为向量嵌入从向量数据库中取回相似文档再将这些文档作为上下文送入大语言模型LLM生成答案。基础 RAG 的准确性受制于查询质量查询模糊、表述不当或者用户对问题的抽象层次把握不准检索结果就会出偏差LLM 拿到的上下文也跟着失真。垃圾输入垃圾输出这个规律在 RAG 场景里同样成立。所以有两类改进方向逐渐成型查询转换Query Translation与查询分解Query Decomposition。前者在查询送入向量数据库之前对其进行变形和扩展后者则把复杂查询拆解成更易处理的子问题。具体技术包括并行查询检索FAN-OUT 架构、倒数排名融合RRF、HyDE假设文档嵌入以及基于思维链的低抽象分解和基于后退提示的高抽象分解。查询转换查询转换的核心思路是不依赖原始查询的单一表述而是生成若干语义相近的变体覆盖更多可能与文档匹配的角度。以RAG 如何改善 LLM 的响应效果为例扩展后可以得到检索增强生成是如何工作的 RAG 对大语言模型的优势检索如何提升 LLM 的准确性这些变体并不改变查询的意图而是换用不同的措辞和切入点让向量搜索有机会命中文档库中表述各异的相关内容从而提高召回率。并行查询检索Fan-Out 检索并行查询检索把上述思路落地为具体架构LLM 基于原始输入生成多个查询变体各变体同时发往向量数据库执行相似度搜索检索结果汇总后去除重复文档最终上下文再传入 LLM。整个流程分六步完成用户发送查询、LLM 生成备选查询、各查询并发执行相似度搜索、合并检索结果、过滤重复文档、将最终上下文传递给 LLM。不同措辞在嵌入空间中的分布位置不同命中的文档集合也会有所差异并行执行正是在利用这一特性。倒数排名融合RRF多路查询的结果合并不能简单拼接了事。各路检索返回的文档存在重叠排名也不尽相同直接合并会导致高质量文档被低质量文档淹没。倒数排名融合RRF解决的正是这个问题。它不看原始相似度分数而是根据文档在每路结果中的排名位置计算分数公式如下其中排名越靠前得分越高在多路结果中反复出现且名次稳定的文档累计分数也更高。经过 RRF 重排后最终上下文的质量比简单合并要可靠得多。HyDE假设文档嵌入HyDE 的逻辑与前两种技术不同它绕开了查询表述不准确这个根源性问题。直接对用户查询做嵌入得到的向量反映的是问题的语义向量数据库里存的是答案文档两者在嵌入空间中的距离未必近。HyDE 的做法是先让 LLM 针对用户查询生成一段假设性的答案或文档再对这段生成文本做嵌入用于相似度搜索。生成文本在风格和内容上更接近真实文档检索准确率往往随之提升。不过需要注意的是这里依赖 LLM 的生成质量参数量偏小的模型生成的假设文档可能失真反而干扰检索。查询分解有些查询本身就包含多个子问题单次检索无法覆盖全部所需信息。把这类查询原封不动地送入向量数据库检索结果往往是残缺的。查询分解把复杂查询拆解为若干粒度更细的子查询分别检索再合并结果。拆解的方向取决于查询的抽象层次——查询可以向上推至更高的概念层也可以向下细化为具体的执行步骤。高抽象分解后退提示后退提示Step-Back Prompting先退一步提出一个比原始查询更高层次的问题再基于这个高层问题检索到的上下文来回答具体问题。以RAG 如何提升 LLM 的性能为例后退查询可以是没有外部知识的 LLM 存在哪些局限性先建立认知框架再回答具体问题检索到的上下文在概念层面会更完整。低抽象分解思维链检索思维链检索把查询拆解为若干有顺序依赖的子步骤前一步的检索结果作为后一步的输入逐步推进。以RAG 是如何工作的它与微调有何不同为例分解过程如下步骤 1——理解 RAG 的概念什么是检索增强生成步骤 2——检索 RAG 工作原理的详细信息RAG 是如何工作的步骤 3——检索微调的相关信息LLM 中的微调是什么步骤 4——对比两个概念RAG 与微调有何区别每个子步骤独立命中一批相关文档前序步骤积累的理解指导后续步骤的检索方向最终由 LLM 整合所有步骤的上下文生成完整答案。这种顺序推理结构在处理跨概念的比较类问题时尤为有效——原始查询包含的概念跨度越大单次检索的信噪比就越低分步处理带来的收益也越明显。总结查询转换和查询分解并不是非此即彼的选择。实际系统里两者往往配合使用Fan-Out 扩展查询覆盖面RRF 保证合并结果的排名质量复杂问题再交给分解流程逐步处理。至于哪种组合适合当前场景取决于查询的典型复杂度、向量库的规模以及系统对延迟的容忍程度——这些判断没有通用答案需要在具体环境里测量。这里给大家精心整理了一份全面的AI大模型学习资源包括AI大模型全套学习路线图从入门到实战、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等资料免费分享扫码免费领取全部内容1. 成长路线图学习规划要学习一门新的技术作为新手一定要先学习成长路线图方向不对努力白费。这里我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。可以说是最科学最系统的学习成长路线。2. 大模型经典PDF书籍书籍和学习文档资料是学习大模型过程中必不可少的我们精选了一系列深入探讨大模型技术的书籍和学习文档它们由领域内的顶尖专家撰写内容全面、深入、详尽为你学习大模型提供坚实的理论基础。书籍含电子版PDF3. 大模型视频教程对于很多自学或者没有基础的同学来说书籍这些纯文字类的学习教材会觉得比较晦涩难以理解因此我们提供了丰富的大模型视频教程以动态、形象的方式展示技术概念帮助你更快、更轻松地掌握核心知识。4. 2026行业报告行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。5. 大模型项目实战学以致用当你的理论知识积累到一定程度就需要通过项目实战在实际操作中检验和巩固你所学到的知识同时为你找工作和职业发展打下坚实的基础。6. 大模型面试题面试不仅是技术的较量更需要充分的准备。在你已经掌握了大模型技术之后就需要开始准备面试我们将提供精心整理的大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。7. 资料领取全套内容免费抱走学 AI 不用再找第二份不管你是 0 基础想入门 AI 大模型还是有基础想冲刺大厂、了解行业趋势这份资料都能满足你现在只需按照提示操作就能免费领取扫码免费领取全部内容

更多文章

前端开发 2026/4/13 9:04:47

Applite：终极免费工具，让macOS软件管理变得如此简单

Applite：终极免费工具，让macOS软件管理变得如此简单【免费下载链接】Applite User-friendly GUI macOS application for Homebrew Casks 项目地址: https://gitcode.com/gh_mirrors/ap/Applite 你是否曾为macOS上的软件管理感到头疼？…

Obsidian社区插件加载失败的终极排查指南最近在整理知识库时发现Obsidian的社区插件市场突然无法加载，这直接打断了我的工作流。作为深度用户，我梳理了从网络配置到插件兼容性的完整解决方案。以下是经过实战验证的修复路径： 1. 基础网络环…

张开发

前端开发 2026/4/10 11:55:01

3种数字记忆拯救方案：用GetQzonehistory守护你的QQ空间青春档案

3种数字记忆拯救方案：用GetQzonehistory守护你的QQ空间青春档案【免费下载链接】GetQzonehistory 获取QQ空间发布的历史说说项目地址: https://gitcode.com/GitHub_Trending/ge/GetQzonehistory 价值定位：当数字记忆面临消失危机 "那条20…

张开发

高级 RAG 技术：查询转换与查询分解

最新文章

告别ST-Link！用串口和Ymodem协议给STM32G474远程升级固件（保姆级教程）

【2026奇点大会权威解码】：文档理解模型的5大技术跃迁与企业落地避坑指南

Janus-Pro-7B实战落地：政务文件扫描件→OCR+政策条款智能关联

树莓派远程开发环境搭建：从系统烧录到VNC文件互传的完整避坑指南（Raspberry Pi OS + RealVNC）

Spring Boot 2.0动态多数据源切换实战教程

R3nzSkin终极指南：如何在英雄联盟中安全体验所有皮肤

推荐文章

龙虾白嫖指南，请查收~勘

AI Agent在金融科技领域的应用实践：风控、投顾与合规

Unity3D动画插件DoTween进阶应用与性能优化指南

超表面贝塞尔光束生成系统代码功能深度解析

【5G系列】深入解析NAS层UAC：Access Identity与Access Category的获取机制

Spring with AI (): 搜索扩展——向量数据库与RAG(下)肺

相关文章

别再死记硬背MIPI状态转换图了！用Python脚本模拟单向/双向Data Lane状态机

HuggingFace模型下载终极优化：Autodl服务器上的国内镜像与断点续传技巧

Python EXE逆向解密深度解析：从加密打包到源码还原的完整流程

基于 Python 与 PyQt5 构建的特斯拉行车记录仪视频播放器

别再搞混了！PyTorch里CrossEntropyLoss和NLLLoss到底该用哪个？（附代码对比）

别再为Linux打印机驱动烦恼：foo2zjs开源驱动彻底解决兼容性问题

分享文章

更多文章

Applite：终极免费工具，让macOS软件管理变得如此简单

Thorium浏览器：革新性Chromium优化方案的性能突破与实践指南

从数据格式到算法适配：禾赛与速腾雷达融合LIO-SAM、FAST-LIO2的实战解析

优化TJpgDec在MM32F5微控制器上的图像解码性能 - 基于MindSDK的实践探索

解析Android Studio中文适配困局：社区语言包的技术架构与部署实践

3步彻底卸载Windows 10 OneDrive：释放空间与提升性能的实用方案

像素剧本圣殿精彩案例分享：赛博朋克导演人格下生成的3分钟短片剧本

Ostrakon-VL终端快速上手：Mac M2/M3芯片本地部署与Metal加速教程

Cadence 17.4 实战技巧：OrCAD 原理图高效生成可检索PDF

成为数据科学家的路线图，第二部分：软件工程

Obsidian社区插件加载失败的3种修复方法（附详细步骤）

3种数字记忆拯救方案：用GetQzonehistory守护你的QQ空间青春档案