从游戏服务器到高频交易：深入聊聊CPU亲和性（Affinity）那些提升性能的骚操作

张开发

• 2026/4/17 19:10:54 • 15 分钟阅读

分享文章

从游戏服务器到高频交易深入聊聊CPU亲和性Affinity那些提升性能的骚操作在追求极致性能的世界里每一纳秒的延迟都意味着真金白银的损失或用户体验的滑坡。想象一下当你精心设计的游戏服务器在高峰期出现卡顿或是高频交易系统因为微秒级的延迟错失最佳交易时机——这些场景背后往往隐藏着一个被忽视的性能杀手操作系统的CPU调度策略。传统的时间片轮转调度虽然公平却可能让关键线程在核心间反复横跳带来不可预测的延迟抖动。这就是为什么从华尔街的交易引擎到顶级游戏服务器都在悄悄使用一种名为CPU亲和性的黑科技。1. CPU亲和性不只是绑定那么简单CPU亲和性Affinity的本质是告诉操作系统这个线程/进程只在这些CPU核心上运行别的地方不去。听起来简单粗暴但背后的原理值得深挖。现代服务器CPU的架构远比我们想象的复杂。以双路28核服务器为例架构特性对性能的影响NUMA节点跨节点访问内存延迟增加30%以上共享L3缓存同核心上的线程可共享缓存超线程逻辑核心共享物理资源可能引发资源争抢关键操作查看系统拓扑# 查看NUMA拓扑 numactl --hardware # 查看CPU缓存信息 lstopo --output /tmp/cpu_topology.png提示绑定前务必先了解硬件拓扑盲目绑定可能适得其反2. 实战从基础绑定到高级策略sched_setaffinity的API使用看似简单但真正的艺术在于绑定策略的设计。让我们看几个典型场景2.1 游戏服务器的绑定策略对于MMORPG服务器通常需要网络IO线程绑定到独立核心物理引擎线程共享核心需相同L3缓存数据库工作线程隔离在NUMA本地节点// 典型的多线程绑定示例 void bind_thread_to_core(pthread_t thread, int core_id) { cpu_set_t cpuset; CPU_ZERO(cpuset); CPU_SET(core_id, cpuset); int rc pthread_setaffinity_np(thread, sizeof(cpu_set_t), cpuset); if (rc ! 0) { syslog(LOG_ERR, Error calling pthread_setaffinity_np: %d, rc); } }2.2 高频交易系统的极致优化金融系统更激进的做法配合isolcpus内核参数完全隔离核心使用SCHED_FIFO实时调度策略禁用超线程以避免资源争抢关键配置文件修改# /etc/default/grub 中添加 GRUB_CMDLINE_LINUXisolcpus2,3,6,7 nohz_full2,3,6,7 rcu_nocbs2,3,6,73. 性能对比数字会说话我们在4种不同场景下测试了绑定前后的性能差异测试场景平均延迟(未绑定)平均延迟(绑定)延迟波动减少游戏AI计算2.3ms1.7ms63%交易订单匹配18μs9μs82%视频帧编码45ms32ms57%数据库事务处理3.2ms2.4ms68%注意测试环境为双路Intel Xeon Gold 6248RUbuntu 20.04 LTS4. 避坑指南那些年我们踩过的雷在金融系统实施CPU绑定时我们曾遇到一个诡异的问题绑定后的性能反而下降了15%。经过两周的排查发现是BIOS设置中未关闭节能模式绑定的核心跨越了NUMA节点未正确设置进程的memory policy推荐的完整检查清单[ ] 确认/proc/sys/kernel/sched_rt_runtime_us设置合理[ ] 检查/sys/devices/system/cpu/cpuX/cpufreq/scaling_governor[ ] 使用perf stat监控上下文切换次数[ ] 验证NUMA内存分配策略5. 监控与调优绑定不是一劳永逸设置亲和性只是开始持续的监控才是关键。我们开发了这样的监控方案# 实时监控CPU亲和性有效性的脚本 import psutil def check_affinity(): for proc in psutil.process_iter([pid, name, cpu_affinity]): if proc.info[name] in [trade_engine, game_server]: actual_cores len(proc.info[cpu_affinity]) print(fProcess {proc.info[pid]} running on {actual_cores} cores) if actual_cores 1: # 违反单核绑定原则 alert_system(proc.info[pid])配套的调优建议当系统负载超过70%时适当放宽绑定限制定期检查/proc/pid/status中的voluntary_ctxt_switches结合cgroup v2实现更精细的资源控制6. 未来思考云原生时代的挑战随着容器化和serverless架构的普及传统的CPU绑定面临新挑战Kubernetes如何支持CPU亲和性# Pod spec示例 spec: containers: - name: game-server resources: requests: cpu: 2 limits: cpu: 2 affinity: nodeAffinity: requiredDuringSchedulingIgnoredDuringExecution: nodeSelectorTerms: - matchExpressions: - key: topology.kubernetes.io/zone operator: In values: - zone-a如何在保持隔离性的同时实现弹性伸缩服务网格sidecar的CPU资源如何分配在一次压力测试中我们发现未绑定的Envoy sidecar竟吃掉了30%的业务CPU时间。最终的解决方案是为sidecar分配专用小核使用cpuset cgroup限制其CPU使用业务进程使用实时优先级

更多文章

前端开发 2026/4/17 19:10:12

Windows下Python安装hnswlib报错？手把手教你用源码编译搞定（附pybind11依赖处理）

Windows下Python安装hnswlib报错？手把手教你用源码编译搞定（附pybind11依赖处理） 在Windows环境下使用Python进行机器学习开发时，第三方库的安装常常会遇到各种编译问题。hnswlib作为一个高效的近似最近邻搜索库，其安…

一、测试目的验证在 SpringBoot 集群 + Nginx 负载均衡环境下，使用 synchronized 本地锁能否保证 “同一用户只能下单一次” 的并发安全，并证明本地锁在集群环境下会失效，从而引出分布式锁的必要性。二、测试环境与架构后端服务同一个 SpringBoot 项目启动两个实…

张开发

前端开发 2026/4/17 18:50:18

LX Music Desktop：打破音乐平台壁垒，一站式免费开源音乐播放器解决方案

LX Music Desktop：打破音乐平台壁垒，一站式免费开源音乐播放器解决方案【免费下载链接】lx-music-desktop 一个基于 Electron 的音乐软件项目地址: https://gitcode.com/GitHub_Trending/lx/lx-music-desktop 你是否也曾经历过这样的烦恼&#…

张开发

从游戏服务器到高频交易：深入聊聊CPU亲和性（Affinity）那些提升性能的骚操作

最新文章

STM32F765VI加持的OpenMV，除了识颜色还能怎么玩？分享5个超实用的DIY项目思路

Remote ID与ADS-B：无人机监管技术的核心差异与应用场景解析

自然语言转代码的“最后一公里”危机：SITS2026数据显示——83%企业卡在测试用例自动生成环节，3套即插即用TestDSL模板限时开放

深入PCA9685数据手册：手把手教你用STM32的IIC调试其所有寄存器（附逻辑分析仪实测波形）

Hyperf方案微服务拆分策略与实践

终极指南：5分钟免费解锁Cursor AI Pro完整功能的完整解决方案

推荐文章

龙虾白嫖指南，请查收~勘

AI Agent在金融科技领域的应用实践：风控、投顾与合规

Unity3D动画插件DoTween进阶应用与性能优化指南

超表面贝塞尔光束生成系统代码功能深度解析

【5G系列】深入解析NAS层UAC：Access Identity与Access Category的获取机制

Spring with AI (): 搜索扩展——向量数据库与RAG(下)肺

相关文章

别再死记硬背MIPI状态转换图了！用Python脚本模拟单向/双向Data Lane状态机

HuggingFace模型下载终极优化：Autodl服务器上的国内镜像与断点续传技巧

Python EXE逆向解密深度解析：从加密打包到源码还原的完整流程

基于 Python 与 PyQt5 构建的特斯拉行车记录仪视频播放器

别再搞混了！PyTorch里CrossEntropyLoss和NLLLoss到底该用哪个？（附代码对比）

别再为Linux打印机驱动烦恼：foo2zjs开源驱动彻底解决兼容性问题

分享文章

更多文章

Windows下Python安装hnswlib报错？手把手教你用源码编译搞定（附pybind11依赖处理）

智能代码生成风格一致性攻坚实录（从CI失败率23%到0.7%的7天改造路径）

Qwen3-Reranker-0.6B开源镜像部署：免编译、免依赖安装，纯Python运行

Winhance中文版终极指南：三步完成Windows系统优化与个性化完整方案

Zynq UDP数据上传性能实测：从10us到100us，丢包率与带宽消耗全解析

拐点来临，AI 安全领导者需立即行动

Harness Engineering即控制论

别再死记硬背了！用Python SymPy库5分钟搞定离散数学命题逻辑真值表

从零到一：手把手搭建你的Seaborn数据可视化开发环境

告别手动改Hosts！用这个Shell脚本自动同步WSL2和Windows的IP（附完整脚本）

秒杀场景下，集群模式的一人一单并发安全测试

LX Music Desktop：打破音乐平台壁垒，一站式免费开源音乐播放器解决方案

从游戏服务器到高频交易：深入聊聊CPU亲和性（Affinity）那些提升性能的骚操作

最新文章

STM32F765VI加持的OpenMV，除了识颜色还能怎么玩？分享5个超实用的DIY项目思路

Remote ID与ADS-B：无人机监管技术的核心差异与应用场景解析

自然语言转代码的“最后一公里”危机：SITS2026数据显示——83%企业卡在测试用例自动生成环节，3套即插即用TestDSL模板限时开放

深入PCA9685数据手册：手把手教你用STM32的IIC调试其所有寄存器（附逻辑分析仪实测波形）

Hyperf方案 微服务拆分策略与实践

终极指南：5分钟免费解锁Cursor AI Pro完整功能的完整解决方案

推荐文章

龙虾白嫖指南，请查收~勘

AI Agent在金融科技领域的应用实践：风控、投顾与合规

Unity3D动画插件DoTween进阶应用与性能优化指南

超表面贝塞尔光束生成系统代码功能深度解析

【5G系列】深入解析NAS层UAC：Access Identity与Access Category的获取机制

Spring with AI (): 搜索扩展——向量数据库与RAG(下)肺

相关文章

别再死记硬背MIPI状态转换图了！用Python脚本模拟单向/双向Data Lane状态机

HuggingFace模型下载终极优化：Autodl服务器上的国内镜像与断点续传技巧

Python EXE逆向解密深度解析：从加密打包到源码还原的完整流程

基于 Python 与 PyQt5 构建的特斯拉行车记录仪视频播放器

别再搞混了！PyTorch里CrossEntropyLoss和NLLLoss到底该用哪个？（附代码对比）

别再为Linux打印机驱动烦恼：foo2zjs开源驱动彻底解决兼容性问题

分享文章

更多文章

Hyperf方案微服务拆分策略与实践