快捷方式

QConfig

class torch.ao.quantization.qconfig.QConfig(activation, weight)[原始碼][原始碼]

描述如何量化一個層 (layer) 或網路的一部分,方法是分別為 activations (激活) 和 weights (權重) 提供設定 (observer classes,觀察者類別)。

請注意,QConfig 需要包含 observer **類別** (例如 MinMaxObserver),或一個可調用 (callable) 的物件,該物件在調用時返回實例,而不是具體的 observer 實例本身。 量化準備函數將為每一層多次實例化觀察者。

觀察者類別通常具有合理的預設參數,但可以使用 with_args 方法覆蓋它們 (其行為類似於 functools.partial)。

my_qconfig = QConfig(
    activation=MinMaxObserver.with_args(dtype=torch.qint8),
    weight=default_observer.with_args(dtype=torch.qint8))

文件

存取 PyTorch 的完整開發者文件

檢視文件

教學

取得為初學者和進階開發者準備的深度教學

檢視教學

資源

尋找開發資源並獲得問題解答

檢視資源