捷徑

write_video

torchvision.io.write_video(filename: str, video_array: Tensor, fps: float, video_codec: str = 'libx264', options: Optional[Dict[str, Any]] = None, audio_array: Optional[Tensor] = None, audio_fps: Optional[float] = None, audio_codec: Optional[str] = None, audio_options: Optional[Dict[str, Any]] = None) None[source]

將 [T, H, W, C] 格式的 4 維張量寫入影片檔案。

此函式依賴 PyAV (因此最終為 FFmpeg) 來編碼影片,您可以參考 FFMpeg wiki 中的其他選項,以獲得更精細的控制。

警告

在不久的將來,我們計劃將 PyTorch 的影片解碼功能集中在 torchcodec 專案中。我們鼓勵您試用並分享您的意見回饋,因為 torchvision 影片解碼器最終將被棄用。

參數:
  • filename (str) – 影片將儲存的路徑

  • video_array (Tensor[T, H, W, C]) – 包含個別影格的張量,格式為 [T, H, W, C] 的 uint8 張量

  • fps (Number) – 影片每秒影格數

  • video_codec (str) – 影片編碼解碼器的名稱,例如 “libx264”、“h264” 等

  • options (Dict) –

    包含要傳遞到 PyAV 影片串流的選項的字典。選項列表取決於編碼解碼器,所有選項都可以在 FFMpeg wiki 中找到。

  • audio_array (Tensor[C, N]) – 包含音訊的張量,其中 C 是聲道數,N 是樣本數

  • audio_fps (Number) – 音訊取樣率,通常為 44100 或 48000

  • audio_codec (str) – 音訊編碼解碼器的名稱,例如 “mp3”、“aac” 等

  • audio_options (Dict) –

    包含要傳遞到 PyAV 音訊串流的選項的字典。選項列表取決於編碼解碼器,所有選項都可以在 FFMpeg wiki 中找到。

範例:
>>> # Creating libx264 video with CRF 17, for visually lossless footage:
>>>
>>> from torchvision.io import write_video
>>> # 1000 frames of 100x100, 3-channel image.
>>> vid = torch.randn(1000, 100, 100, 3, dtype = torch.uint8)
>>> write_video("video.mp4", options = {"crf": "17"})

文件

存取 PyTorch 的完整開發者文件

檢視文件

教學

為初學者和進階開發者取得深入的教學

檢視教學

資源

尋找開發資源並獲得解答

檢視資源