当前位置: 首页 > news >正文

GPU虚拟化实现(五)

GPU虚拟化实现(五)

  • 章节回顾
  • 初步介绍
  • 详细介绍
    • 核心数据结构
    • 核心功能和运作机制
      • 初始化
      • 显存分配
      • 显存释放
      • 显存溢出检查
      • 显存类型检查
      • 查看分配信息
    • 代码执行流程
    • 假设例子
  • 总结

章节回顾

在上一章,简单介绍了项目拦截cuda函数的流程,其本质上与拦截nvml函数的流程是一致的,都是首先将源函数的地址存储在列表的指针中,当拦截到函数时跳转到自定义实现的函数,需要特殊处理就特殊处理,如不需要转到源函数去处理。在这一章,将会介绍这个项目的allocator模块。

初步介绍

项目中的allocator模块时自定义实现的 CUDA 设备显存分配器,主要负责实际的显存分配、释放、追踪和 OOM 检查。

详细介绍

核心数据结构

分配器的运作依赖于几个关键的数据结构(定义在 allocator.h 中):

  1. allocated_device_memory_struct
struct allocated_device_memory_struct{CUdeviceptr address;                       // 设备显存的指针size_t length;                             // 分配的大小CUcontext ctx;                             // 关联的 CUDA 上下文CUmemGenericAllocationHandle *allocHandle; // 分配句柄
};
typedef struct allocated_device_memory_struct allocated_device_memory;

这个结构体用来存储单块已分配的 CUDA 设备显存的关键信息。
2. allocated_list_structallocated_list_entry_struct

struct allocated_list_entry_struct{allocated_device_memory *entry;;struct allocated_list_entry_struct *next,*prev;
};
typedef struct allocated_list_entry_struct allocated_list_entry;struct allocated_list_struct{allocated_list_entry *head;allocated_list_entry *tail;size_t length;
};
typedef struct allocated_list_struct allocated_list;

allocated_list_entry定义了双向链表中的一个节点。每个节点代表着一块被追踪的设备显存。
allocated_list是一个双向链表,用于存储分配的显存记录。
3. region_struct, region_list_structregion_list_entry_struct(在 allocator.c 这个文件的代码逻辑里,并没有直接使用 region 相关的结构和逻辑)

struct region_struct{size_t start;size_t freemark;size_t freed_map;size_t length;CUcontext ctx;allocated_list *region_allocs;char *bitmap;CUmemGenericAllocationHandle *allocHandle;
};
typedef struct region_struct region;struct region_list_entry_struct{region *entry;struct region_list_entry_struct *next,*prev;
};
typedef struct region_list_entry_struct region_list_entry;struct region_list_struct{region_list_entry   *head;region_list_entry   *tail;size_t length;
};
typedef struct region_list_struct region_list;

大白话解释:
想象 GPU 显存是一整块大蛋糕,为了方便管理,我们先把它分成几块“大蛋糕”(region),每一块大蛋糕都有自己的档案,记录大小、位置、还有哪些部分被切走了。大蛋糕的档案都串在一起(region_list_entry),放在一个总账本里(region_list),让你随时能找到所有大蛋糕的信息。

每块大蛋糕还能再切成很多“小蛋糕”,分给不同的任务用。每块小蛋糕的信息(位置、大小、谁在用)也记录在小纸条上(allocated_device_memory),这些小纸条串成一串(allocated_list_entry),放在一个小账本里(allocated_list)。而每个大蛋糕的档案里,都有一个指向自己小账本的指针(region_allocs),让你知道从这块大蛋糕切出去的小蛋糕有哪些。

核心功能和运作机制

初始化

// allocator.c
void allocator_init(){LOG_DEBUG("Allocator_init\n");device_overallocated = malloc(sizeof(allocated_list));LIST_INIT(device_overallocated);pthread_mutex_init(&mutex,NULL);
}
// allocator.h
#define LIST_INIT(list) {   \list->head=NULL;         \list->tail=NULL;         \list

相关文章:

  • 深度学习前沿探秘:Transformer 模型与多领域应用
  • 深度学习---Pytorch概览
  • tsconfig.json的配置项介绍
  • 高效管理app内测分发,蒲公英了解一下?
  • 跨境电商店铺矩阵布局:多账号运营理论到实操全解析
  • 【QinAgent应用案例】从开发到管理,QinAgent为某智能家居企业提效50%,降本20%
  • Web基础与HTTP协议
  • mac 基于Docker安装minio
  • Docker和K8s面试题
  • 当所有人都用上先进ai,如何保持你的优势?
  • git 如何清空当前分支的历史提交记录,仅保留最后一次提交
  • [minilibc] 库文件的调用放置
  • 一种用于从视网膜图像中识别疾病的 BERT 式自监督学习 CNN
  • 国联股份卫多多与北京慧闻科技(集团)签署战略合作协议
  • 自动驾驶领域专业词汇(专业术语)整理
  • day9 python 热力图与子图的绘制
  • 一键叠图工具
  • 免费的多数据库连接管理工具-支持达梦、Oracle、MySQL、PostgreSQL数据库!
  • Crawl4AI,智能体网络自动采集利器
  • 爬虫过程中如何确保数据准确性
  • 来伊份一季度净利减少近八成,今年集中精力帮助加盟商成功
  • 演员刘美含二手集市被曝售假,本人道歉
  • 央行副行长:增强外汇市场韧性,坚决对市场顺周期行为进行纠偏
  • 坚守刑事检察一线13年,“在我心中每次庭审都是一次大考”
  • 习近平在中共中央政治局第二十次集体学习时强调,坚持自立自强,突出应用导向,推动人工智能健康有序发展
  • 来论|这无非就是一只“纸老虎”:评特朗普政府“关税战”