AMDGPU XGMI 支持¶
AMDGPU XGMI 支持
XGMI 是一种高速互连,它将多个 GPU 卡连接到同构的内存空间中,该内存空间由一个集体 Hive ID 和单独的节点 ID 组织,两者都是 64 位数字。
文件 xgmi_device_id 包含每个 GPU 设备唯一的 ID,并存储在 /sys/class/drm/card${cardno}/device/ 目录中。
在设备目录中,创建了一个子目录“xgmi_hive_info”,其中包含 Hive ID 和节点列表。
- Hive ID 存储在
/sys/class/drm/card${cardno}/device/xgmi_hive_info/xgmi_hive_id
- 节点信息存储在编号的目录中
/sys/class/drm/card${cardno}/device/xgmi_hive_info/node${nodeno}/xgmi_device_id
每个设备都有自己的 xgmi_hive_info 目录,其中包含一组镜像节点子目录。
XGMI 内存空间是通过将每个节点以 2 的幂填充的 VRAM 空间连续地添加到彼此来构建的。