• 文件 >
  • 安裝預先建置的二進位檔 >
  • 舊版本 (穩定版)
捷徑

安裝預先建置的二進位檔

torchaudio 有 PyPI (pip) 和 Anaconda (conda) 的二進位發行版。

請參閱 https://pytorch.dev.org.tw/get-started/locally/ 了解詳細資訊。

注意

每個 torchaudio 套件都針對特定版本的 torch 編譯。請參考下表並安裝正確的 torchtorchaudio 組合。

注意

0.10 開始,torchaudio 有僅限 CPU 和啟用 CUDA 的二進位發行版,每個發行版都需要相應的 PyTorch 發行版。

注意

此軟體是針對 FFmpeg 的未修改副本編譯的,並移除了特定的 rpath,以便能夠使用系統函式庫。可以從以下位置下載 LGPL 原始碼:n4.1.8 (license), n5.0.3 (license) and n6.0 (license)。

依賴性

  • PyTorch

    請參考以下相容性矩陣,了解支援的 PyTorch 版本。

可選的依賴性

  • FFmpeg

    使用 torchaudio.io 模組和 backend="ffmpeg"I/O 函式中時,需要此依賴性。

    從 2.1 版本開始,TorchAudio 官方二進位發行版與 FFmpeg 版本 6、5 和 4 相容。(>=4.4, <7)。在執行時,TorchAudio 首先尋找 FFmpeg 6,如果找不到,則繼續尋找 5,然後再尋找 4。

    有多種方法可以安裝 FFmpeg 函式庫。請參考官方文件,了解如何安裝 FFmpeg。如果您使用的是 Anaconda Python 發行版,conda install -c conda-forge 'ffmpeg<7' 將會安裝相容的 FFmpeg 函式庫。

    如果您需要指定 TorchAudio 搜尋和連結的 FFmpeg 版本,您可以使用環境變數 TORIO_USE_FFMPEG_VERSION 來指定。例如,設定 TORIO_USE_FFMPEG_VERSION=5,TorchAudio 將只會尋找 FFmpeg 5。

    如果因為某些原因,此搜尋機制造成問題,您可以完全停用 FFmpeg 整合,方法是設定環境變數 TORIO_USE_FFMPEG=0

    有多種方式可以安裝 FFmpeg 函式庫。如果您使用 Anaconda Python 發行版,conda install -c conda-forge 'ffmpeg<7' 將會安裝相容的 FFmpeg 函式庫。

    注意

    在搜尋 FFmpeg 安裝時,TorchAudio 會尋找帶有版本號碼的函式庫檔案名稱。也就是說,Linux 上的 libavutil.so.<VERSION>、macOS 上的 libavutil.<VERSION>.dylib 和 Windows 上的 avutil-<VERSION>.dll。許多公開的預先構建二進位檔案都遵循這種命名方式,但有些發行版具有未帶版本號碼的檔案名稱。如果您在偵測 FFmpeg 時遇到困難,請仔細檢查您安裝的函式庫檔案是否遵循這種命名方式 (然後確保它們位於函式庫搜尋路徑中列出的目錄之一)。

  • SoX

    需要在 I/O 函式中使用 backend="sox"

    從 2.1 版本開始,TorchAudio 需要單獨安裝 libsox。

    如果動態連結導致問題,您可以設定環境變數 TORCHAUDIO_USE_SOX=0,這樣 TorchAudio 就不會使用 SoX。

    注意

    TorchAudio 尋找沒有版本號碼的函式庫檔案,也就是 Linux 上的 libsox.so 和 macOS 上的 libsox.dylib。有些套件管理器會使用不同的名稱安裝函式庫檔案。例如,Ubuntu 上的 aptitude 會安裝 libsox.so.3。要讓 TorchAudio 連結到它,您可以建立一個符號連結,名稱為 libsox.so(並將該符號連結放在函式庫搜尋路徑中)。

    注意

    TorchAudio 在 libsox 14.4.2 上進行了測試。(其他版本不太可能有效。)

  • SoundFile

    需要在 I/O 函式中使用 backend="soundfile"

  • sentencepiece

    使用 Emformer RNN-T 執行自動語音辨識時需要此套件。您可以執行 pip install sentencepiece 來安裝它。

  • deep-phonemizer

    使用 Tacotron2 文字轉語音 執行文字轉語音時需要此套件。

  • kaldi_io

    需要使用 torchaudio.kaldi_io 模組。

相容性矩陣

TorchAudio 的官方二進位發行版包含以 C++ 編寫並連結到特定 PyTorch 版本的擴充模組。

來自不同版本的 TorchAudio 和 PyTorch 不能一起使用。請參考下表以了解匹配的版本。

PyTorch

TorchAudio

Python

2.1.0

2.1.0

>=3.8, <=3.11

2.0.1

2.0.2

>=3.8, <=3.11

2.0.0

2.0.1

>=3.8, <=3.11

1.13.1

0.13.1

>=3.7, <=3.10

1.13.0

0.13.0

>=3.7, <=3.10

1.12.1

0.12.1

>=3.7, <=3.10

1.12.0

0.12.0

>=3.7, <=3.10

1.11.0

0.11.0

>=3.7, <=3.9

1.10.0

0.10.0

>=3.6, <=3.9

1.9.1

0.9.1

>=3.6, <=3.9

1.8.1

0.8.1

>=3.6, <=3.9

1.7.1

0.7.2

>=3.6, <=3.9

1.7.0

0.7.0

>=3.6, <=3.8

1.6.0

0.6.0

>=3.6, <=3.8

1.5.0

0.5.0

>=3.5, <=3.8

1.4.0

0.4.0

==2.7, >=3.5, <=3.8

文件

存取 PyTorch 的完整開發者文件

查看文件

教學

取得針對初學者和進階開發人員的深入教學課程

查看教學課程

資源

尋找開發資源並獲得您的問題解答

查看資源