raft_large¶

torchvision.models.optical_flow.raft_large(*, weights: Optional[Raft_Large_Weights] = None, progress=True, **kwargs) → RAFT[原始碼]¶

來自 RAFT: Recurrent All Pairs Field Transforms for Optical Flow 的 RAFT 模型。

請參閱以下範例，以取得有關如何使用此模型的教學課程。

參數:

weights (Raft_Large_Weights, optional) – 要使用的預訓練權重。有關更多詳細資訊和可能的值，請參閱下方的 Raft_Large_Weights。預設情況下，不使用任何預訓練權重。
progress (bool) – 如果為 True，則會在 stderr 中顯示下載的進度列。預設值為 True。
**kwargs – 傳遞給 torchvision.models.optical_flow.RAFT 基底類別的參數。有關此類別的更多詳細資訊，請參閱原始碼。

class torchvision.models.optical_flow.Raft_Large_Weights(value)[原始碼]¶

上面的模型建構器接受以下值作為 weights 參數。 Raft_Large_Weights.DEFAULT 等同於 Raft_Large_Weights.C_T_SKHT_V2。您也可以使用字串，例如 weights='DEFAULT' 或 weights='C_T_V1'。

這裡報告的指標如下。epe 是「端點誤差」(end-point-error)，表示預測的光流與真實值的差距 (以像素為單位)。這是對所有圖像的所有像素取平均值。per_image_epe 類似，但平均方式不同：先針對每張圖像獨立計算 epe，然後再對所有圖像取平均值。這相當於原始論文中的 "Fl-epe" (有時寫作 "F1-epe")，並且僅在 Kitti 資料集上使用。fl-all 也是一個 Kitti 特定的指標，由資料集的作者定義，用於 Kitti 排行榜。它對應於 epe 小於 <3px 或小於光流 2-範數的 <5% 的像素的平均值。

Raft_Large_Weights.C_T_V1:

這些權重是從原始論文移植過來的。它們在 FlyingChairs + FlyingThings3D 上進行訓練。

epe (在 Sintel-Train-Cleanpass 上)	1.4411
epe (在 Sintel-Train-Finalpass 上)	2.7894
per_image_epe (在 Kitti-Train 上)	5.0172
fl_all (在 Kitti-Train 上)	17.4506
min_size	height=128, width=128
num_params	5257536
recipe	link
GFLOPS	211.01
File size	20.1 MB

推論轉換位於 Raft_Large_Weights.C_T_V1.transforms，並執行以下預處理操作：接受 PIL.Image、批次的 (B, C, H, W) 和單個 (C, H, W) 圖像 torch.Tensor 物件。圖像會被縮放到 [-1.0, 1.0]。

Raft_Large_Weights.C_T_V2:

這些權重是從頭開始在 FlyingChairs + FlyingThings3D 上訓練的。

epe (在 Sintel-Train-Cleanpass 上)	1.3822
epe (在 Sintel-Train-Finalpass 上)	2.7161
per_image_epe (在 Kitti-Train 上)	4.5118
fl_all (在 Kitti-Train 上)	16.0679
min_size	height=128, width=128
num_params	5257536
recipe	link
GFLOPS	211.01
File size	20.1 MB

推論轉換位於 Raft_Large_Weights.C_T_V2.transforms，並執行以下預處理操作：接受 PIL.Image、批次的 (B, C, H, W) 和單個 (C, H, W) 圖像 torch.Tensor 物件。圖像會被縮放到 [-1.0, 1.0]。

Raft_Large_Weights.C_T_SKHT_V1:

這些權重是從原始論文移植過來的。它們在 FlyingChairs + FlyingThings3D 上進行訓練，並在 Sintel 上進行微調。Sintel 微調步驟是 Sintel、KittiFlow、HD1K 和 FlyingThings3D (clean pass) 的組合。

epe (在 Sintel-Test-Cleanpass 上)	1.94
epe (在 Sintel-Test-Finalpass 上)	3.18
min_size	height=128, width=128
num_params	5257536
recipe	link
GFLOPS	211.01
File size	20.1 MB

推論轉換位於 Raft_Large_Weights.C_T_SKHT_V1.transforms，並執行以下預處理操作：接受 PIL.Image、批次的 (B, C, H, W) 和單個 (C, H, W) 圖像 torch.Tensor 物件。圖像會被縮放到 [-1.0, 1.0]。

Raft_Large_Weights.C_T_SKHT_V2:

這些權重是從頭開始訓練的。它們在 FlyingChairs + FlyingThings3D 上進行預訓練，然後在 Sintel 上進行微調。Sintel 微調步驟是 Sintel、KittiFlow、HD1K 和 FlyingThings3D (clean pass) 的組合。也可以作為 Raft_Large_Weights.DEFAULT 使用。

epe (在 Sintel-Test-Cleanpass 上)	1.819
epe (在 Sintel-Test-Finalpass 上)	3.067
min_size	height=128, width=128
num_params	5257536
recipe	link
GFLOPS	211.01
File size	20.1 MB

推論轉換位於 Raft_Large_Weights.C_T_SKHT_V2.transforms，並執行以下預處理操作：接受 PIL.Image、批次的 (B, C, H, W) 和單個 (C, H, W) 圖像 torch.Tensor 物件。圖像會被縮放到 [-1.0, 1.0]。

Raft_Large_Weights.C_T_SKHT_K_V1:

這些權重是從原始論文移植過來的。它們在 FlyingChairs + FlyingThings3D 上進行預訓練，在 Sintel 上進行微調，然後在 KittiFlow 上進行微調。Sintel 微調步驟如上所述。

fl_all (在 Kitti-Test 上)	5.1
min_size	height=128, width=128
num_params	5257536
recipe	link
GFLOPS	211.01
File size	20.1 MB

推論轉換可在 Raft_Large_Weights.C_T_SKHT_K_V1.transforms 中找到，並執行以下預處理操作：接受 PIL.Image、批次化的 (B, C, H, W) 和單張 (C, H, W) 影像 torch.Tensor 物件。影像會重新縮放到 [-1.0, 1.0]。

Raft_Large_Weights.C_T_SKHT_K_V2:

這些權重是從頭開始訓練的。它們首先在 FlyingChairs + FlyingThings3D 上進行預訓練，然後在 Sintel 上進行微調，最後在 KittiFlow 上進行微調。上面已描述了 Sintel 微調步驟。

fl_all (在 Kitti-Test 上)	5.19
min_size	height=128, width=128
num_params	5257536
recipe	link
GFLOPS	211.01
File size	20.1 MB

推論轉換可在 Raft_Large_Weights.C_T_SKHT_K_V2.transforms 中找到，並執行以下預處理操作：接受 PIL.Image、批次化的 (B, C, H, W) 和單張 (C, H, W) 影像 torch.Tensor 物件。影像會重新縮放到 [-1.0, 1.0]。

使用 raft_large 的範例

光流：使用 RAFT 模型預測移動

raft_large¶

文件

教學課程

資源