從原始碼建置¶
TorchAudio 整合了 PyTorch 用於數值計算,以及第三方函式庫用於多媒體 I/O。它需要以下工具才能從原始碼建置。
CUDA toolkit 和 cuDNN (如果建置 CUDA 擴充功能)
大多數工具都可以在 Conda 中找到,因此我們建議使用 conda。
自訂建置¶
TorchAudio 與第三方函式庫的整合可以透過環境變數啟用/停用。
它們可以透過傳遞 1
來啟用,以及透過 0
來停用。
BUILD_SOX
:啟用/停用基於 libsox 的 I/O 功能。BUILD_KALDI
:啟用/停用基於 Kaldi 的特徵提取。BUILD_RNNT
:啟用/停用自訂 RNN-T 損失函數。USE_FFMPEG
:啟用/停用基於 FFmpeg 函式庫的 I/O 功能。USE_ROCM
:啟用/停用 AMD ROCm 支援。USE_CUDA
:啟用/停用 CUDA 支援。
有關最新的配置及其預設值,請檢查原始程式碼。https://github.com/pytorch/audio/blob/main/tools/setup_helpers/extension.py