快捷鍵

read_video

torchvision.io.read_video(filename: str, start_pts: Union[float, Fraction] = 0, end_pts: Optional[Union[float, Fraction]] = None, pts_unit: str = 'pts', output_format: str = 'THWC') Tuple[Tensor, Tensor, Dict[str, Any]][原始碼]

從檔案讀取影片,並傳回影片影格和音訊影格

警告

在不久的將來,我們計劃將 PyTorch 的影片解碼功能集中在 torchcodec 專案中。我們鼓勵您試用並分享您的意見回饋,因為 torchvision 影片解碼器最終將被棄用。

參數:
  • filename (str) – 影片檔案的路徑。如果使用 pyav 後端,這可以是 av.open 接受的任何內容。

  • start_pts (python:int if pts_unit = 'pts', python:float / Fraction if pts_unit = 'sec', optional) – 影片的開始呈現時間

  • end_pts (python:int if pts_unit = 'pts', python:float / Fraction if pts_unit = 'sec', optional) – 影片的結束呈現時間

  • pts_unit (str, optional) – start_pts 和 end_pts 值將被解讀的單位,可以是 'pts' 或 'sec'。預設為 'pts'。

  • output_format (str, optional) – 輸出影片張量的格式。可以是 “THWC”(預設)或 “TCHW”。

傳回:

vframes (Tensor[T, H, W, C] 或 Tensor[T, C, H, W]): T 個影片影格 aframes (Tensor[K, L]):音訊影格,其中 K 是通道數,L 是點數 info (Dict):影片和音訊的中繼資料。可以包含欄位 video_fps (float) 和 audio_fps (int)

傳回類型:

vframes (Tensor[T, H, W, C] 或 Tensor[T, C, H, W])

使用 read_video 的範例

光流:使用 RAFT 模型預測移動

光流:使用 RAFT 模型預測移動

文件

存取 PyTorch 的完整開發者文件

查看文件

教學

取得針對初學者和進階開發者的深入教學

查看教學

資源

尋找開發資源並獲得問題解答

查看資源