捷徑

SceneFlowStereo

class torchvision.datasets.SceneFlowStereo(root: Union[str, Path], variant: str = 'FlyingThings3D', pass_name: str = 'clean', transforms: Optional[Callable] = None)[原始碼]

用於 Scene Flow 資料集的資料集介面。 此介面提供對 FlyingThings3D、`MonkaaDriving 資料集的存取。

資料集預期具有以下結構

root
    SceneFlow
        Monkaa
            frames_cleanpass
                scene1
                    left
                        img1.png
                        img2.png
                    right
                        img1.png
                        img2.png
                scene2
                    left
                        img1.png
                        img2.png
                    right
                        img1.png
                        img2.png
            frames_finalpass
                scene1
                    left
                        img1.png
                        img2.png
                    right
                        img1.png
                        img2.png
                ...
                ...
            disparity
                scene1
                    left
                        img1.pfm
                        img2.pfm
                    right
                        img1.pfm
                        img2.pfm
        FlyingThings3D
            ...
            ...
參數:
  • root (str 或 pathlib.Path) – SceneFlow 所在的根目錄。

  • variant (string) – 要使用的資料集變體,“FlyingThings3D”(預設)、“Monkaa”或“Driving”。

  • pass_name (string) – 要使用的 pass,“clean”(預設)、“final”或“both”。

  • transforms (callable, optional) – 接收一個樣本並傳回轉換版本的函式/轉換。

特殊成員:

__getitem__(index: int) Tuple[Image, Image, Optional[ndarray], ndarray][source]

傳回給定索引的範例。

參數:

index (int) – 要檢索的範例索引

傳回:

一個包含 (img_left, img_right, disparity) 的三元組。視差 (disparity) 是一個形狀為 (1, H, W) 的 numpy 陣列,而影像為 PIL 影像。 如果在 transforms 參數中生成 valid_mask,則會傳回包含 (img_left, img_right, disparity, valid_mask) 的四元組。

傳回類型:

tuple

文件

存取 PyTorch 的完整開發人員文件

檢視文件

教學

取得適合初學者和進階開發人員的深入教學課程

檢視教學

資源

尋找開發資源並獲得問題解答

檢視資源