mlir 编译器学习笔记之四 -- 调度

张开发

• 2026/4/16 23:19:58 • 15 分钟阅读

分享文章

调度表调度模调度整数线性规划(NP适合热点) 全局/路径调度(跨分支投机a) 调度的时候资源并行度是关键考虑需要先分析读、写、定义的依赖分析指令readylistb) 传统的readlist发射可以考虑关键逻辑优先但实际还要考虑寄存器、内存所以Priority(insn) f(关键逻辑优先级-寄存器压力增量)c) 对应单个BB, 正向或者反向分析是一样的结果。当跨BB时才存在差异正向并行反向投机d) 可以通过任务依赖图查看依赖分析准确性和调度甘特图查看调度结果1、指令的活跃区间 LiveRange [startTime, endTime]startTime: 节点开始执行的时间指令被发射到功能单元endTime: 节点结果就绪的时间指令执行完成结果可用前驱指令P: R1 R2 R3 // LiveRange: [10, 12]当前指令C: R4 R1 * 2 // 什么时候可以开始 R1 就绪即endTime2、普通调度 (严格顺序) 硬件循环允许重叠的原因T1 max(preStart hardware_switch_overhead,preEnd loop_iteration_period - latency)普通调度OOO可以提前发射但会在流水线中等待硬件循环可以更早开始执行因为有数据转发 (专有硬件不竞争通用资源)3、资源占用级联模式时需要多个功能单元4、“operand #0 does not dominate this use”。这个错误通常发生在SSA静态单赋值形式中当某个值在定义之前被使用或者控制流导致某个值在某个使用点可能没有被定义5、mlir中调度控制流scf算子(isaRegionBranchOpInterface(op))并不是BB的边界该函数在遍历基本块的操作时遇到scf::ForOp或scf::IfOp时会将之前积累的连续普通操作区间保存递归地进入ForOp的内部区域收集区域内部的操作范围然后继续从ForOp的下一个操作开始积累新的区间。因此ForOp本身作为分隔点它既不被包含在前一个区间也不被包含在后一个区间它自身也不被当作一个区间。这样划分后每个区间都是不含任何区域分支操作的一段连续操作

更多文章

前端开发 2026/4/16 23:17:27

BERTopic模型部署终极指南：构建生产级主题分析API服务

BERTopic模型部署终极指南：构建生产级主题分析API服务 BERTopic是一款结合BERT与c-TF-IDF技术的主题建模工具，能够从文本数据中高效提取可解释的主题。本指南将带你完成从环境配置到API部署的全流程，帮助你快速构建生产级的主题分析服务。 …

张开发

前端开发 2026/4/16 23:14:13

LinuxCNC终极指南：从零开始掌握开源数控系统

LinuxCNC终极指南：从零开始掌握开源数控系统【免费下载链接】linuxcnc LinuxCNC controls CNC machines. It can drive milling machines, lathes, 3d printers, laser cutters, plasma cutters, robot arms, hexapods, and more. 项目地址: https://gitcode.com…

张开发

前端开发 2026/4/16 23:13:25

Türkçe Yapay Zeka Kaynakları框架比较：TensorFlow vs PyTorch vs Keras

Trke Yapay Zeka Kaynakları框架比较：TensorFlow vs PyTorch vs Keras 【免费下载链接】turkce-yapay-zeka-kaynaklari Trkiyede yapılan derin ğrenme (deep learning) ve makine ğrenmesi (machine learning) alışmalarının derlendiği sayfa. 项目地址…

张开发

前端开发 2026/4/16 23:05:56

2025届必备的十大AI辅助论文网站推荐榜单

Ai论文网站排名（开题报告、文献综述、降aigc率、降重综合对比） TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 旨在减少人工智能生成内容里可检测特征，让文本更贴近人类写作风格的降AIGC工具&a…

张开发

前端开发 2026/4/16 22:57:28

去掉 UWB / 蓝牙标签：浙江普陀时空大数据应用技术联合研究院无感定位，免穿戴、免部署、降本、全场景覆盖

去掉UWB/蓝牙标签：浙江普陀时空大数据应用技术联合研究院无感定位技术方案版本：V1.0 发布单位：浙江普陀时空大数据应用技术联合研究院、镜像视界（浙江）科技有限公司发布日期：2026年04月一、方案摘要本方案…

张开发

前端开发 2026/4/16 22:57:21

手把手教你用18650电池和FM模块，做个能播歌能当话筒的移动小电台

18650电池与FM模块打造多功能便携电台：从音乐广播到无线话筒的全能方案在户外露营、小型聚会或是临时活动现场，一个能播放音乐又能充当无线话筒的便携设备往往能派上大用场。市面上专业设备价格不菲，而利用常见的18650电池和带屏幕的FM模块&…

张开发

前端开发 2026/4/16 22:44:30

mysql如何查看当前数据库的字符编码_使用SHOW VARIABLES LIKE查看

SHOW CREATE DATABASE your_db_name 是唯一可靠方式，可查数据库实际编码；SHOW VARIABLES LIKE character% 仅显示服务器默认值，不能反映库、表、列三级实际编码。SHOW VARIABLES LIKE character% 查不到完整编码信息？直接执行 SHO…

张开发

前端开发 2026/4/16 22:44:30

收藏必备：小白程序员快速入门大模型与多智能体实战指南

本文介绍了如何利用阿里云的 AgentScope 框架和 Spring AI Alibaba 升级版，实现大模型在企业业务线中的规模化落地。文章从单智能体优先原则出发，详细阐述了多种多智能体模式（如 Pipeline、Routing、Skills、Subagents、Supervisor、Handoffs…

张开发

前端开发 2026/4/16 22:44:30

能量距离理解

理解 Energy Distance（能量距离）的关键，是把它看作衡量两个概率分布“差异”的一种方式。它的核心思想很简单：比较“分布内部的点的平均距离”和“分布之间的点的平均距离”。核心原理能量距离的数学定义是：当 PQ …

张开发

前端开发 2026/4/16 22:43:36

如何快速将OneNote笔记转换为Markdown格式：OneNote Md Exporter完整指南

如何快速将OneNote笔记转换为Markdown格式：OneNote Md Exporter完整指南【免费下载链接】onenote-md-exporter ConsoleApp to export OneNote notebooks to Markdown formats 项目地址: https://gitcode.com/gh_mirrors/on/onenote-md-exporter OneNote Md …

张开发

前端开发 2026/4/16 22:43:30

Rust的#[must_use]属性：标记不应忽略的返回值

在Rust编程语言中，错误处理和资源管理是开发者日常关注的重点。为了帮助开发者避免因忽略函数返回值而导致的潜在问题，Rust引入了#[must_use]属性。这一属性能够强制开发者显式处理函数的返回值，从而减少因疏忽引发的错误。本文将详细介绍#[m…

张开发

前端开发 2026/4/16 22:40:44

解决在Ubuntu系统下使用运行Lucid 相机(HTR003S-001)相应实例出现的依赖库缺失的问题

https://blog.csdn.net/m0_46090849/article/details/160031386?sharetypeblogdetail&sharerId160031386&sharereferPC&sharesourcem0_46090849&spm1011.2480.3001.8118 这篇文章讲了如何在ubuntu20.04中使用ArenaView MP，虽然已经运行成功&#…

张开发

mlir 编译器学习笔记之四 -- 调度

最新文章

kotlin中一般用高介函数代替return

flutter doctor问题解决

Arduino新手必看：用PS2摇杆控制舵机转动的5个常见问题及解决方案

保姆级教程：在DataGrip 2023.3中配置TDengine 3.x的JDBC驱动（附驱动包下载）

c++，进制在生活中的运用以及不同进制相互转换的代码的通用模板

从0到1打造PyQt5价格预测桌面工具：Qt Designer可视化设计+机器学习模型部署全流程

推荐文章

龙虾白嫖指南，请查收~勘

AI Agent在金融科技领域的应用实践：风控、投顾与合规

Unity3D动画插件DoTween进阶应用与性能优化指南

超表面贝塞尔光束生成系统代码功能深度解析

【5G系列】深入解析NAS层UAC：Access Identity与Access Category的获取机制

Spring with AI (): 搜索扩展——向量数据库与RAG(下)肺

相关文章

别再死记硬背MIPI状态转换图了！用Python脚本模拟单向/双向Data Lane状态机

HuggingFace模型下载终极优化：Autodl服务器上的国内镜像与断点续传技巧

Python EXE逆向解密深度解析：从加密打包到源码还原的完整流程

基于 Python 与 PyQt5 构建的特斯拉行车记录仪视频播放器

别再搞混了！PyTorch里CrossEntropyLoss和NLLLoss到底该用哪个？（附代码对比）

别再为Linux打印机驱动烦恼：foo2zjs开源驱动彻底解决兼容性问题

分享文章

更多文章

BERTopic模型部署终极指南：构建生产级主题分析API服务

LinuxCNC终极指南：从零开始掌握开源数控系统

Türkçe Yapay Zeka Kaynakları框架比较：TensorFlow vs PyTorch vs Keras

2025届必备的十大AI辅助论文网站推荐榜单

去掉 UWB / 蓝牙标签：浙江普陀时空大数据应用技术联合研究院无感定位，免穿戴、免部署、降本、全场景覆盖

手把手教你用18650电池和FM模块，做个能播歌能当话筒的移动小电台

mysql如何查看当前数据库的字符编码_使用SHOW VARIABLES LIKE查看

收藏必备：小白程序员快速入门大模型与多智能体实战指南

能量距离理解

如何快速将OneNote笔记转换为Markdown格式：OneNote Md Exporter完整指南

Rust的#[must_use]属性：标记不应忽略的返回值

解决在Ubuntu系统下使用运行Lucid 相机(HTR003S-001)相应实例出现的依赖库缺失的问题