AMDGPU XGMI 支持

AMDGPU XGMI 支持

XGMI 是一种高速互连,它将多个 GPU 卡连接到同构的内存空间中,该内存空间由一个集体 Hive ID 和单独的节点 ID 组织,两者都是 64 位数字。

文件 xgmi_device_id 包含每个 GPU 设备唯一的 ID,并存储在 /sys/class/drm/card${cardno}/device/ 目录中。

在设备目录中,创建了一个子目录“xgmi_hive_info”,其中包含 Hive ID 和节点列表。

Hive ID 存储在

/sys/class/drm/card${cardno}/device/xgmi_hive_info/xgmi_hive_id

节点信息存储在编号的目录中

/sys/class/drm/card${cardno}/device/xgmi_hive_info/node${nodeno}/xgmi_device_id

每个设备都有自己的 xgmi_hive_info 目录,其中包含一组镜像节点子目录。

XGMI 内存空间是通过将每个节点以 2 的幂填充的 VRAM 空间连续地添加到彼此来构建的。