安裝預先建置的二進位檔¶

torchaudio 有 PyPI (pip) 和 Anaconda (conda) 的二進位發行版。

請參閱 https://pytorch.dev.org.tw/get-started/locally/ 了解詳細資訊。

注意

每個 torchaudio 套件都針對特定版本的 torch 編譯。請參考下表並安裝正確的 torch 和 torchaudio 組合。

注意

從 0.10 開始，torchaudio 有僅限 CPU 和啟用 CUDA 的二進位發行版，每個發行版都需要相應的 PyTorch 發行版。

注意

此軟體是針對 FFmpeg 的未修改副本編譯的，並移除了特定的 rpath，以便能夠使用系統函式庫。可以從以下位置下載 LGPL 原始碼：n4.1.8 (license), n5.0.3 (license) and n6.0 (license)。

依賴性¶

PyTorch

請參考以下相容性矩陣，了解支援的 PyTorch 版本。

可選的依賴性¶

FFmpeg

使用 torchaudio.io 模組和 backend="ffmpeg" 在 I/O 函式中時，需要此依賴性。

從 2.1 版本開始，TorchAudio 官方二進位發行版與 FFmpeg 版本 6、5 和 4 相容。（>=4.4, <7）。在執行時，TorchAudio 首先尋找 FFmpeg 6，如果找不到，則繼續尋找 5，然後再尋找 4。

有多種方法可以安裝 FFmpeg 函式庫。請參考官方文件，了解如何安裝 FFmpeg。如果您使用的是 Anaconda Python 發行版，conda install -c conda-forge 'ffmpeg<7' 將會安裝相容的 FFmpeg 函式庫。

如果您需要指定 TorchAudio 搜尋和連結的 FFmpeg 版本，您可以使用環境變數 TORIO_USE_FFMPEG_VERSION 來指定。例如，設定 TORIO_USE_FFMPEG_VERSION=5，TorchAudio 將只會尋找 FFmpeg 5。

如果因為某些原因，此搜尋機制造成問題，您可以完全停用 FFmpeg 整合，方法是設定環境變數 TORIO_USE_FFMPEG=0。

有多種方式可以安裝 FFmpeg 函式庫。如果您使用 Anaconda Python 發行版，conda install -c conda-forge 'ffmpeg<7' 將會安裝相容的 FFmpeg 函式庫。

注意

在搜尋 FFmpeg 安裝時，TorchAudio 會尋找帶有版本號碼的函式庫檔案名稱。也就是說，Linux 上的 libavutil.so.<VERSION>、macOS 上的 libavutil.<VERSION>.dylib 和 Windows 上的 avutil-<VERSION>.dll。許多公開的預先構建二進位檔案都遵循這種命名方式，但有些發行版具有未帶版本號碼的檔案名稱。如果您在偵測 FFmpeg 時遇到困難，請仔細檢查您安裝的函式庫檔案是否遵循這種命名方式 (然後確保它們位於函式庫搜尋路徑中列出的目錄之一)。
SoX

需要在 I/O 函式中使用 backend="sox"。

從 2.1 版本開始，TorchAudio 需要單獨安裝 libsox。

如果動態連結導致問題，您可以設定環境變數 TORCHAUDIO_USE_SOX=0，這樣 TorchAudio 就不會使用 SoX。

注意

TorchAudio 尋找沒有版本號碼的函式庫檔案，也就是 Linux 上的 libsox.so 和 macOS 上的 libsox.dylib。有些套件管理器會使用不同的名稱安裝函式庫檔案。例如，Ubuntu 上的 aptitude 會安裝 libsox.so.3。要讓 TorchAudio 連結到它，您可以建立一個符號連結，名稱為 libsox.so（並將該符號連結放在函式庫搜尋路徑中）。

注意

TorchAudio 在 libsox 14.4.2 上進行了測試。（其他版本不太可能有效。）
SoundFile

需要在 I/O 函式中使用 backend="soundfile"。
sentencepiece

使用 Emformer RNN-T 執行自動語音辨識時需要此套件。您可以執行 pip install sentencepiece 來安裝它。
deep-phonemizer

使用 Tacotron2 文字轉語音執行文字轉語音時需要此套件。
kaldi_io

需要使用 torchaudio.kaldi_io 模組。

相容性矩陣¶

TorchAudio 的官方二進位發行版包含以 C++ 編寫並連結到特定 PyTorch 版本的擴充模組。

來自不同版本的 TorchAudio 和 PyTorch 不能一起使用。請參考下表以了解匹配的版本。

`PyTorch`	`TorchAudio`	`Python`
`2.1.0`	`2.1.0`	`>=3.8`, `<=3.11`
`2.0.1`	`2.0.2`	`>=3.8`, `<=3.11`
`2.0.0`	`2.0.1`	`>=3.8`, `<=3.11`
`1.13.1`	`0.13.1`	`>=3.7`, `<=3.10`
`1.13.0`	`0.13.0`	`>=3.7`, `<=3.10`
`1.12.1`	`0.12.1`	`>=3.7`, `<=3.10`
`1.12.0`	`0.12.0`	`>=3.7`, `<=3.10`
`1.11.0`	`0.11.0`	`>=3.7`, `<=3.9`
`1.10.0`	`0.10.0`	`>=3.6`, `<=3.9`
`1.9.1`	`0.9.1`	`>=3.6`, `<=3.9`
`1.8.1`	`0.8.1`	`>=3.6`, `<=3.9`
`1.7.1`	`0.7.2`	`>=3.6`, `<=3.9`
`1.7.0`	`0.7.0`	`>=3.6`, `<=3.8`
`1.6.0`	`0.6.0`	`>=3.6`, `<=3.8`
`1.5.0`	`0.5.0`	`>=3.5`, `<=3.8`
`1.4.0`	`0.4.0`	`==2.7`, `>=3.5`, `<=3.8`

安裝預先建置的二進位檔¶

依賴性¶

可選的依賴性¶

相容性矩陣¶

文件

教學

資源