从LeetCode刷题到实际项目：我是这样用PriorityQueue解决TopK和合并区间问题的

张开发

• 2026/4/18 7:28:25 • 15 分钟阅读

分享文章

从LeetCode刷题到实际项目我是这样用PriorityQueue解决TopK和合并区间问题的去年在重构公司推荐系统时遇到一个性能瓶颈实时计算用户兴趣标签的Top10商品。当第一次用PriorityQueue优雅地解决这个问题后我才真正理解算法书上说的堆这种数据结构在流式数据处理中的独特优势。今天就用两个LeetCode经典题目347.前K个高频元素和56.合并区间作为引子分享如何把PriorityQueue从刷题工具升级为工程利器。1. 为什么PriorityQueue成为面试常客在硅谷某大厂的系统设计面试中面试官曾问我如果要设计一个实时显示当前最热门的100条微博你会选择什么数据结构这个问题直接戳中了PriorityQueue的核心价值——它能在O(n log k)时间复杂度内解决TopK问题而空间复杂度仅需O(k)。Java中的PriorityQueue是基于优先级堆的无界队列默认是最小堆。但通过自定义Comparator我们可以实现最大堆(a, b) - b - a多维排序比如先按频率降序再按字母升序复杂对象比较比如比较Map.Entry的值// 三种经典比较器写法对比 PriorityQueueInteger maxHeap1 new PriorityQueue(Collections.reverseOrder()); PriorityQueueInteger maxHeap2 new PriorityQueue((a, b) - b - a); PriorityQueueInteger maxHeap3 new PriorityQueue(new ComparatorInteger() { public int compare(Integer a, Integer b) { return b.compareTo(a); } });注意在工程中推荐使用compareTo而非减法避免整数溢出问题。比如Integer.MIN_VALUE - 1会导致错误。2. TopK问题的标准解法与工程变形LeetCode 347题要求返回数组中出现频率前K高的元素。这个题目完美展示了堆的筛选能力public int[] topKFrequent(int[] nums, int k) { MapInteger, Integer frequencyMap new HashMap(); for (int num : nums) { frequencyMap.put(num, frequencyMap.getOrDefault(num, 0) 1); } PriorityQueueMap.EntryInteger, Integer heap new PriorityQueue((a, b) - a.getValue() - b.getValue()); for (Map.EntryInteger, Integer entry : frequencyMap.entrySet()) { heap.offer(entry); if (heap.size() k) { heap.poll(); } } int[] result new int[k]; for (int i 0; i k; i) { result[i] heap.poll().getKey(); } return result; }但在实际项目中我们往往需要处理更复杂的情况。比如在电商推荐系统中我遇到过这样的需求场景解决方案时间复杂度静态数据TopK直接排序O(n log n)流式数据TopK维护大小为K的堆O(n log k)带权重的分布式TopK每个节点计算本地TopK再合并O(n log k)有时间衰减的TopK使用跳表堆的混合结构O(log n)一个实际案例在实现猜你喜欢功能时我们需要对用户最近3天的行为日志实时计算。这时候用PriorityQueue配合时间窗口比直接用排序节省了70%的内存开销。3. 合并区间问题中的堆妙用LeetCode 56题的合并区间常规解法是排序后线性扫描。但在监控告警系统中当需要合并数万个时间窗口时使用堆可以更灵活地处理动态输入的区间public int[][] merge(int[][] intervals) { Arrays.sort(intervals, (a, b) - a[0] - b[0]); PriorityQueueint[] heap new PriorityQueue((a, b) - b[1] - a[1]); for (int[] interval : intervals) { if (!heap.isEmpty() heap.peek()[1] interval[0]) { int[] merged new int[]{heap.peek()[0], Math.max(heap.peek()[1], interval[1])}; heap.poll(); heap.offer(merged); } else { heap.offer(interval); } } return heap.toArray(new int[heap.size()][]); }这个解法在以下业务场景特别有用日志聚合合并相同错误码的连续发生时间段会议安排动态调整会议室使用时间段交通调度合并车辆GPS轨迹中的停留区间在实现阿里云监控告警系统时我们就用类似的方法处理了每秒数万条的事件流。通过自定义比较器还能实现诸如优先合并时长超过5分钟的区间等业务规则。4. 从语法糖到设计模式Comparator的进阶用法Java 8的lambda表达式让比较器的编写变得简洁但在复杂业务中我们需要更系统的设计。以下是三种典型场景的比较器实现策略场景1多级排序// 先按频率降序再按字母升序 ComparatorMap.EntryString, Integer comparator Comparator.Map.EntryString, IntegercomparingInt(Entry::getValue) .reversed() .thenComparing(Entry::getKey);场景2空值处理ComparatorString nullSafeComparator Comparator.nullsFirst( Comparator.naturalOrder() );场景3业务规则组合public class BusinessComparator implements ComparatorOrder { private static final int VIP_WEIGHT 100; private static final int URGENCY_BONUS 50; public int compare(Order a, Order b) { int priorityA calculatePriority(a); int priorityB calculatePriority(b); return priorityB - priorityA; } private int calculatePriority(Order order) { int base order.getAmount(); if (order.isVip()) base VIP_WEIGHT; if (order.isUrgent()) base URGENCY_BONUS; return base; } }在美团的外卖调度系统中我们就是用类似的多维度比较器实现了骑手派单的优先级队列。一个经验之谈当比较逻辑超过5行时就应该考虑封装成独立的Comparator类而不是用lambda表达式。5. 性能陷阱与最佳实践在高压面试中我曾被要求优化一个使用堆的代码。原实现虽然功能正确但在处理百万级数据时会出现GC问题。以下是几个关键优化点内存优化技巧预分配堆的初始容量new PriorityQueue(k)使用基本类型替代对象比如LongPriorityQueue第三方库避免频繁的offer/poll操作批量处理数据时间复杂度对比操作时间复杂度适用场景offerO(log n)构建堆pollO(log n)获取堆顶peekO(1)查看堆顶remove(Object)O(n)应尽量避免在堆中使用一个真实案例在优化知乎热榜算法时我们发现用PriorityQueue处理实时点击流会导致年轻代GC频繁。最终方案是改用TreeMap实现的双堆结构将GC时间减少了80%。

更多文章

前端开发 2026/4/18 7:28:24

统好AI数据中枢：四大核心能力解析

在企业数智化转型中，数据的整合、流转与应用能力，直接决定转型成效。绵阳统好软件有限公司打造的统好AI，以数据中台为核心底座，构建起涵盖实时数据协同、智能决策支持、全流程数据看板的完整数据中枢体系，让数据真正成…

学习目标理解最小堆（优先队列）在算法中的应用掌握分治思想解决多路合并问题能够分析K路归并的复杂度理解为什么堆比直接两两合并更优为处理海量数据排序问题打下基础一、问题引入 1.1 题目描述 LeetCode 23：给定k个升序链表数组&#x…

张开发

前端开发 2026/4/17 15:17:02

5分钟掌握暗黑破坏神2存档编辑：新手也能轻松修改角色装备

5分钟掌握暗黑破坏神2存档编辑：新手也能轻松修改角色装备【免费下载链接】d2s-editor 项目地址: https://gitcode.com/gh_mirrors/d2/d2s-editor 想要打造理想中的暗黑破坏神2角色吗？d2s-editor这款免费开源工具让你轻松修改单机存档&#xff0…

张开发

从LeetCode刷题到实际项目：我是这样用PriorityQueue解决TopK和合并区间问题的

最新文章

用GraphQL替代RESTful API，我们得到了什么又失去了什么？

【S32K3实战指南】LPSPI外设配置与多从机通信设计

抖音视频下载终极指南：douyin-downloader完整使用教程

Pixel Aurora Engine 构建数字人素材库：快速生成多样化人物肖像与表情

04华夏之光永存：黄大年茶思屋榜文解法「第8期第4题」港口雾天引航高精度目标探测工程化解决方案

告别RTOS：用时间片轮询在裸机上实现“伪多任务”

推荐文章

龙虾白嫖指南，请查收~勘

AI Agent在金融科技领域的应用实践：风控、投顾与合规

Unity3D动画插件DoTween进阶应用与性能优化指南

超表面贝塞尔光束生成系统代码功能深度解析

【5G系列】深入解析NAS层UAC：Access Identity与Access Category的获取机制

Spring with AI (): 搜索扩展——向量数据库与RAG(下)肺

相关文章

别再死记硬背MIPI状态转换图了！用Python脚本模拟单向/双向Data Lane状态机

HuggingFace模型下载终极优化：Autodl服务器上的国内镜像与断点续传技巧

Python EXE逆向解密深度解析：从加密打包到源码还原的完整流程

基于 Python 与 PyQt5 构建的特斯拉行车记录仪视频播放器

别再搞混了！PyTorch里CrossEntropyLoss和NLLLoss到底该用哪个？（附代码对比）

别再为Linux打印机驱动烦恼：foo2zjs开源驱动彻底解决兼容性问题

分享文章

更多文章

统好AI数据中枢：四大核心能力解析

Win10专业版多用户远程桌面配置全攻略（含RDPWraper避坑指南）

别再只会复制粘贴了！用Python的shutil.move实现桌面文件自动分类（附完整代码）

Mac/Win双平台实测：Android Studio关联AOSP源码实现代码跳转的完整避坑指南

FastGPT vs LlamaIndex：哪个更适合你的AI问答系统？（附实战对比）

Java自动化茅台预约系统架构深度解析：Spring Boot与Redis缓存实战指南

Git冷命令

Codex写脚本

C语言中的变量

终极免费Windows风扇控制软件FanControl：专业散热管理完全指南

【笔面试算法学习专栏】合并K个升序链表：堆与分治的完美结合

5分钟掌握暗黑破坏神2存档编辑：新手也能轻松修改角色装备