目錄

捷徑

從原始碼建置¶

TorchAudio 整合了 PyTorch 用於數值計算，以及第三方函式庫用於多媒體 I/O。它需要以下工具才能從原始碼建置。

PyTorch
CMake
Ninja
支援 C++ 17 的 C++ 編譯器
- GCC (Linux)
- Clang (macOS)
- MSVC 2019 或更新版本 (Windows)
CUDA toolkit 和 cuDNN (如果建置 CUDA 擴充功能)

大多數工具都可以在 Conda 中找到，因此我們建議使用 conda。

自訂建置¶

TorchAudio 與第三方函式庫的整合可以透過環境變數啟用/停用。

它們可以透過傳遞 1 來啟用，以及透過 0 來停用。

BUILD_SOX：啟用/停用基於 libsox 的 I/O 功能。
BUILD_KALDI：啟用/停用基於 Kaldi 的特徵提取。
BUILD_RNNT：啟用/停用自訂 RNN-T 損失函數。
USE_FFMPEG：啟用/停用基於 FFmpeg 函式庫的 I/O 功能。
USE_ROCM：啟用/停用 AMD ROCm 支援。
USE_CUDA：啟用/停用 CUDA 支援。

有關最新的配置及其預設值，請檢查原始程式碼。https://github.com/pytorch/audio/blob/main/tools/setup_helpers/extension.py

文件

取得 PyTorch 的完整開發者文件

檢視文件

教學

取得初學者和進階開發者的深入教學

檢視教學

資源

尋找開發資源並獲得問題解答

檢視資源