快捷方式

torchvision

此函式庫是 PyTorch 專案的一部分。 PyTorch 是一個開放原始碼的機器學習框架。

此文件中描述的功能按發布狀態分類

穩定版: 這些功能將長期維護,並且通常不會有主要的效能限制或文件中的差距。 我們也希望保持向後相容性(儘管可能會發生重大變更,並且會在提前一個版本通知)。

Beta 版: 這些功能被標記為 Beta 版,因為 API 可能會根據使用者回饋而變更,因為效能需要提高,或者因為運算子的涵蓋範圍尚未完整。 對於 Beta 版功能,我們致力於將該功能推展到穩定版。 但是,我們不承諾向後相容性。

原型: 這些功能通常無法作為二進位發行版(如 PyPI 或 Conda)的一部分提供,除非有時在執行時標記之後,並且處於回饋和測試的早期階段。

torchvision 套件包含流行的資料集、模型架構和用於電腦視覺的常見影像轉換。

範例和訓練參考

torchvision.get_image_backend()[原始碼]

取得用於載入圖片的套件名稱

torchvision.get_video_backend()[原始碼]

傳回目前用於解碼影片的影片後端。

傳回:

影片後端的名稱。選項為 {‘pyav’, ‘video_reader’}。

傳回類型:

str

torchvision.set_image_backend(backend)[原始碼]

指定用於載入圖片的套件。

參數:

backend (string) – 圖片後端的名稱。選項為 {‘PIL’, ‘accimage’}。accimage 套件使用 Intel IPP 函式庫。 通常比 PIL 快,但不支援那麼多的操作。

torchvision.set_video_backend(backend)[原始碼]

指定用於解碼影片的套件。

參數:

backend (string) – 影片後端的名稱。選項為 {‘pyav’, ‘video_reader’}。pyav 套件使用第三方 PyAv 函式庫。它是 FFmpeg 函式庫的 Python 繫結。video_reader 套件包含基於 FFMPEG 函式庫的原生 C++ 實作,以及 TorchScript 自訂運算子的 python API。 它通常比 pyav 解碼更快,但可能較不穩定。

注意

在最新的 main 中,預設停用使用 FFMPEG 進行建置。 如果您想使用 ‘video_reader’ 後端,請從原始碼編譯 torchvision。

使用 set_video_backend 的範例

影片 API

影片 API

索引

文件

存取 PyTorch 的完整開發人員文件

檢視文件

教學課程

取得適合初學者和進階開發人員的深入教學課程

檢視教學課程

資源

尋找開發資源並取得問題解答

檢視資源