当前位置: 首页 > news >正文

Linux 内核中 cgroup 子系统 cpuset 是什么?

cpuset 是 Linux 内核中 cgroup(控制组) 的一个子系统,用于将一组进程(或任务)绑定到特定的 CPU 核心内存节点(NUMA 节点)上运行。它通过限制进程的 CPU 和内存资源的使用范围,优化系统性能(如减少缓存失效、提高 NUMA 本地性)或实现资源隔离(如容器场景)。


1. 核心功能

  1. CPU 绑定
    将进程限制在指定的 CPU 核心(或超线程)上运行,避免跨核心的上下文切换,提高缓存利用率。

  2. 内存节点绑定
    在 NUMA 架构中,将进程的内存分配限制在指定的 NUMA 节点,减少跨节点访问内存的延迟。

  3. 动态迁移控制
    允许或禁止进程在绑定 CPU 核心之间迁移。


2. 关键配置参数

在 cgroup 的 cpuset 子系统中,通过以下文件配置资源范围:

文件作用
cpuset.cpus指定允许使用的 CPU 核心列表(如 0-31,5)。
cpuset.mems指定允许使用的内存节点(NUMA 节点)列表(如 00-1)。
cpuset.cpu_exclusive是否独占 CPU 核心(其他 cgroup 不能使用相同的 CPU)。
cpuset.mem_exclusive是否独占内存节点(其他 cgroup 不能使用相同的内存节点)。
cpuset.memory_migrate当内存节点不可用时,是否自动迁移进程的内存到新节点。
cpuset.sched_load_balance是否允许内核在这些 CPU 上执行负载均衡(默认允许)。

3. 使用场景

  1. 容器资源隔离
    在 Docker、Kubernetes 等容器平台中,通过 cpuset 限制容器只能使用指定的 CPU 核心和内存节点,避免资源争抢。

    docker run --cpuset-cpus="0-3" --cpuset-mems="0" my_container
    
  2. 高性能计算
    将计算密集型任务绑定到专用 CPU 核心,减少上下文切换开销,提高缓存命中率。

  3. NUMA 优化
    在 NUMA 架构服务器中,将进程及其内存分配到同一 NUMA 节点,降低内存访问延迟。


4. 配置示例

1. 手动配置 cgroup
# 创建 cgroup
mkdir /sys/fs/cgroup/cpuset/my_group# 分配 CPU 0-3 和内存节点 0
echo 0-3 > /sys/fs/cgroup/cpuset/my_group/cpuset.cpus
echo 0 > /sys/fs/cgroup/cpuset/my_group/cpuset.mems# 禁止负载均衡(专用核心)
echo 0 > /sys/fs/cgroup/cpuset/my_group/cpuset.sched_load_balance# 将进程 PID 1234 加入该 cgroup
echo 1234 > /sys/fs/cgroup/cpuset/my_group/tasks
2. 通过 systemd 配置

在 systemd 服务文件中添加:

[Service]
CPUAffinity=0-3
AllowedCPUs=0-3
AllowedMemoryNodes=0

5. 注意事项

  • 父子 cgroup 继承性:子 cgroup 的 CPU 和内存范围不能超出父 cgroup 的范围。
  • 默认值:如果未设置 cpuset.mems,进程可能无法分配内存。
  • 动态迁移:若允许迁移(cpuset.memory_migrate=1),进程内存可能被迁移到新节点,但可能引入延迟。

6. cpuset vs cpu 子系统

  • cpuset:控制进程在哪些物理 CPU 核心和内存节点上运行。
  • cpu:控制进程的 CPU 时间分配(通过 CFS 或实时调度策略)。

通过 cpuset,可以精细控制进程的物理资源位置,尤其适合对性能敏感或需要严格隔离的场景(如容器、虚拟化、HPC)。

相关文章:

  • 【专题刷题】滑动窗口(三)
  • 【系统架构设计师】嵌入式微处理器
  • 2025-04-22| Docker: --privileged参数详解
  • Ansys Zemax | 在 MATLAB 中使用 ZOS-API 的技巧
  • 最美丽的区间
  • Trino分布式 SQL 查询引擎
  • [Java · 铢积寸累] 数据结构 — 数组类型 - 概念引入
  • 【数据结构和算法】5. 堆栈和队列
  • 算法基础_数据结构【KMP + Trie 树 + 并查集 】
  • postgreSQL 如何使用 dblink
  • 微信小程序拖拽排序有效果图
  • 机器人进阶---视觉算法(六)傅里叶变换在图像处理中怎么用
  • 【Pytorch 中的扩散模型】去噪扩散概率模型(DDPM)的实现
  • Facebook商城开通全攻略:如何解决所在地区不可使用问题?
  • IPoIB驱动接收路径深度解析:从数据包到协议栈
  • 在Pytorch中使用Tensorboard可视化训练过程
  • 晨控CK-FR12与欧姆龙NX系列PLC配置EtherNet/IP通讯连接操作手册
  • Spring Boot多环境配置详解
  • GTS-400 系列运动控制器板(七)----修改限位开关触发电平
  • Cline Roo Code
  • 今天是世界读书日,上海准备了哪些文化大餐?
  • 民生访谈|电动自行车换新补贴会优化吗?今年汛期情况如何?市应急局回应
  • 又一名被拐孩子找到!29年后,在警方帮助下云南男子寻子成功
  • “HPV男女共防计划”北半马主题活动新闻发布会在京举办
  • 国家开发银行原副行长李吉平一审获刑14年
  • 艺术开卷|近现代中国古代书画东渡日本的历史图景