AMDGPU XGMI 支持

AMDGPU XGMI 支持

XGMI 是一种高速互连技术,它将多个 GPU 卡连接到一个同质内存空间中,该空间由一个集体蜂巢 ID 和单独的节点 ID 组织,这两者都是 64 位数字。

文件 xgmi_device_id 包含每个 GPU 设备唯一的 ID,并存储在 /sys/class/drm/card${cardno}/device/ 目录中。

在 device 目录中,会创建一个子目录 'xgmi_hive_info',其中包含蜂巢 ID 和节点列表。

蜂巢 ID 存储在

/sys/class/drm/card${cardno}/device/xgmi_hive_info/xgmi_hive_id

节点信息存储在编号的目录中

/sys/class/drm/card${cardno}/device/xgmi_hive_info/node${nodeno}/xgmi_device_id

每个设备都有自己的 xgmi_hive_info 方向,其中包含一组镜像的节点子目录。

XGMI 内存空间是通过将每个节点 2 的幂填充的 VRAM 空间连续相加构建的。