SquimSubjective¶
- class torchaudio.models.SquimSubjective(ssl_model: Module, projector: Module, predictor: Module)[來源]¶
語音品質和可理解性測量 (SQUIM) 模型,用於預測語音增強的主觀指標分數 (例如,平均意見分數 (MOS))。該模型採用自 NORESQA-MOS [Manocha and Kumar, 2022],該模型在給定輸入語音和非匹配參考的情況下預測 MOS 分數。
- 參數:
ssl_model (torch.nn.Module) – 用於特徵提取的自我監督學習模型。
projector (torch.nn.Module) – 將 SSL 特徵投影到較低維度的投影層。
predictor (torch.nn.Module) – 預測主觀分數。
- 使用
SquimSubjective
的教學
方法¶
forward¶
- SquimSubjective.forward(waveform: Tensor, reference: Tensor)[來源]¶
預測主觀評估指標分數。
- 參數:
waveform (torch.Tensor) – 用於評估的輸入波形。維度為 (批次, 時間) 的張量。
reference (torch.Tensor) – 非匹配的乾淨參考。維度為 (批次, time_ref) 的張量。
- 返回:
主觀指標分數。維度為 (批次,) 的張量。
- 返回類型:
工廠函數¶
建置自訂 |
|
使用預設參數建置 |