torchvision¶
此函式庫是 PyTorch 專案的一部分。 PyTorch 是一個開放原始碼的機器學習框架。
此文件中描述的功能按發布狀態分類
穩定版: 這些功能將長期維護,並且通常不會有主要的效能限制或文件中的差距。 我們也希望保持向後相容性(儘管可能會發生重大變更,並且會在提前一個版本通知)。
Beta 版: 這些功能被標記為 Beta 版,因為 API 可能會根據使用者回饋而變更,因為效能需要提高,或者因為運算子的涵蓋範圍尚未完整。 對於 Beta 版功能,我們致力於將該功能推展到穩定版。 但是,我們不承諾向後相容性。
原型: 這些功能通常無法作為二進位發行版(如 PyPI 或 Conda)的一部分提供,除非有時在執行時標記之後,並且處於回饋和測試的早期階段。
torchvision
套件包含流行的資料集、模型架構和用於電腦視覺的常見影像轉換。
- torchvision.get_video_backend()[原始碼]¶
傳回目前用於解碼影片的影片後端。
- 傳回:
影片後端的名稱。選項為 {‘pyav’, ‘video_reader’}。
- 傳回類型:
- torchvision.set_image_backend(backend)[原始碼]¶
指定用於載入圖片的套件。
- 參數:
backend (string) – 圖片後端的名稱。選項為 {‘PIL’, ‘accimage’}。
accimage
套件使用 Intel IPP 函式庫。 通常比 PIL 快,但不支援那麼多的操作。
- torchvision.set_video_backend(backend)[原始碼]¶
指定用於解碼影片的套件。
- 參數:
backend (string) – 影片後端的名稱。選項為 {‘pyav’, ‘video_reader’}。
pyav
套件使用第三方 PyAv 函式庫。它是 FFmpeg 函式庫的 Python 繫結。video_reader
套件包含基於 FFMPEG 函式庫的原生 C++ 實作,以及 TorchScript 自訂運算子的 python API。 它通常比pyav
解碼更快,但可能較不穩定。
注意
在最新的 main 中,預設停用使用 FFMPEG 進行建置。 如果您想使用 ‘video_reader’ 後端,請從原始碼編譯 torchvision。
使用
set_video_backend
的範例