torch.cuda.memory_stats¶

torch.cuda.memory_stats(device=None)[原始碼][原始碼]¶

傳回給定裝置的 CUDA 記憶體配置器統計資料字典。

此函數的傳回值為統計資料字典，其中每個統計資料都是一個非負整數。

核心統計資料

"allocated.{all,large_pool,small_pool}.{current,peak,allocated,freed}"：記憶體配置器接收到的配置請求數量。
"allocated_bytes.{all,large_pool,small_pool}.{current,peak,allocated,freed}"：已配置的記憶體數量。
"segment.{all,large_pool,small_pool}.{current,peak,allocated,freed}"：從 cudaMalloc() 保留的區段數量。
"reserved_bytes.{all,large_pool,small_pool}.{current,peak,allocated,freed}"：保留的記憶體數量。
"active.{all,large_pool,small_pool}.{current,peak,allocated,freed}"：活動記憶體區塊的數量。
"active_bytes.{all,large_pool,small_pool}.{current,peak,allocated,freed}"：活動記憶體的數量。
"inactive_split.{all,large_pool,small_pool}.{current,peak,allocated,freed}"：非活動、不可釋放記憶體區塊的數量。
"inactive_split_bytes.{all,large_pool,small_pool}.{current,peak,allocated,freed}"：非活動、不可釋放記憶體的數量。

對於這些核心統計資料，值會按如下方式分解。

Pool 類型

指標類型

除了核心統計資料外，我們還提供一些簡單的事件計數器

可以透過 ENV 配置快取配置器，以防止分割大於定義大小的區塊（請參閱 Cuda 語意文件的記憶體管理部分）。這有助於避免記憶體碎片，但可能會造成效能損失。提供其他輸出以協助調整和評估影響

"max_split_size"：大於此大小的區塊將不會被分割。
"oversize_allocations.{current,peak,allocated,freed}"：記憶體配置器接收到的超大配置請求數量。
"oversize_segments.{current,peak,allocated,freed}"：從 cudaMalloc() 保留的超大區段數量。

可以透過 ENV 配置快取配置器，以捨入記憶體配置，以減少碎片。有時，捨入的額外負擔可能高於其有助於減少的碎片。可以使用以下統計資料來檢查捨入是否增加了太多額外負擔

"requested_bytes.{all,large_pool,small_pool}.{current,peak,allocated,freed}"：客戶端程式碼請求的記憶體，將其與 allocated_bytes 比較，以檢查配置捨入是否增加了太多額外負擔。

參數: device (torch.device 或 int, optional) – 選取的裝置。如果 device 為 None（預設），則傳回 current_device() 給定的目前裝置的統計資料。
傳回類型: Dict[str, Any]

注意

有關 GPU 記憶體管理的更多詳細資訊，請參閱記憶體管理。

注意

使用 backend:cudaMallocAsync 時，某些統計資料沒有意義，並且始終報告為零。

文件