快速連結

SquimSubjective

class torchaudio.models.SquimSubjective(ssl_model: Module, projector: Module, predictor: Module)[來源]

語音品質和可理解性測量 (SQUIM) 模型,用於預測語音增強的主觀指標分數 (例如,平均意見分數 (MOS))。該模型採用自 NORESQA-MOS [Manocha and Kumar, 2022],該模型在給定輸入語音和非匹配參考的情況下預測 MOS 分數。

參數:
使用 SquimSubjective 的教學
Torchaudio-Squim: Non-intrusive Speech Assessment in TorchAudio

Torchaudio-Squim:TorchAudio 中非侵入式語音評估

Torchaudio-Squim:TorchAudio 中非侵入式語音評估

方法

forward

SquimSubjective.forward(waveform: Tensor, reference: Tensor)[來源]

預測主觀評估指標分數。

參數:
  • waveform (torch.Tensor) – 用於評估的輸入波形。維度為 (批次, 時間) 的張量。

  • reference (torch.Tensor) – 非匹配的乾淨參考。維度為 (批次, time_ref) 的張量。

返回:

主觀指標分數。維度為 (批次,) 的張量。

返回類型:

(torch.Tensor)

工廠函數

squim_subjective_model

建置自訂 torchaudio.prototype.models.SquimSubjective 模型。

squim_subjective_base

使用預設參數建置 torchaudio.prototype.models.SquimSubjective 模型。

文件

存取 PyTorch 的完整開發者文件

查看文件

教學

取得初學者和進階開發者的深入教學

查看教學

資源

尋找開發資源並獲得問題解答

查看資源