快捷方式

Linear

class torch.ao.nn.quantized.Linear(in_features, out_features, bias_=True, dtype=torch.qint8)[原始碼][原始碼]

一個量化的線性模組,其輸入和輸出都是量化的張量。我們採用與 torch.nn.Linear 相同的介面,請參閱 https://pytorch.dev.org.tw/docs/stable/nn.html#torch.nn.Linear 以取得文件。

Linear 類似,屬性將在模組建立時隨機初始化,並在稍後被覆寫

變數
  • weight (Tensor) – 模組的不可學習的量化權重,形狀為 (out_features,in_features)(\text{out\_features}, \text{in\_features})

  • bias (Tensor) – 模組的不可學習的偏差,形狀為 (out_features)(\text{out\_features})。 如果 biasTrue,則值初始化為零。

  • scale – 輸出量化張量的 scale 參數,類型:double

  • zero_point – 輸出量化張量的 zero_point 參數,類型:long

範例

>>> m = nn.quantized.Linear(20, 30)
>>> input = torch.randn(128, 20)
>>> input = torch.quantize_per_tensor(input, 1.0, 0, torch.quint8)
>>> output = m(input)
>>> print(output.size())
torch.Size([128, 30])
classmethod from_float(mod, use_precomputed_fake_quant=False)[原始碼][原始碼]

從一個被觀察的浮點模組建立一個量化模組

參數
  • mod (Module) – 一個浮點模組,可以由 torch.ao.quantization 工具產生,或由使用者提供

  • use_precomputed_fake_quant (bool) – 如果為 True,則模組將重用來自預先計算的 fake quant 模組的 min/max 值。

classmethod from_reference(ref_qlinear, output_scale, output_zero_point)[原始碼][原始碼]

從一個參考量化模組建立一個 (fbgemm/qnnpack) 量化模組

參數
  • ref_qlinear (Module) – 一個參考量化線性模組,可以由 torch.ao.quantization 工具產生,或由使用者提供

  • output_scale (float) – 輸出張量的 scale

  • output_zero_point (int) – 輸出張量的 zero point

文件

存取 PyTorch 的完整開發者文件

查看文件

教學

取得針對初學者和進階開發者的深入教學

查看教學

資源

尋找開發資源並取得您問題的解答

查看資源