QConfig¶
- class torch.ao.quantization.qconfig.QConfig(activation, weight)[原始碼][原始碼]¶
描述如何量化一個層 (layer) 或網路的一部分,方法是分別為 activations (激活) 和 weights (權重) 提供設定 (observer classes,觀察者類別)。
請注意,QConfig 需要包含 observer **類別** (例如 MinMaxObserver),或一個可調用 (callable) 的物件,該物件在調用時返回實例,而不是具體的 observer 實例本身。 量化準備函數將為每一層多次實例化觀察者。
觀察者類別通常具有合理的預設參數,但可以使用 with_args 方法覆蓋它們 (其行為類似於 functools.partial)。
my_qconfig = QConfig( activation=MinMaxObserver.with_args(dtype=torch.qint8), weight=default_observer.with_args(dtype=torch.qint8))