resnet152¶
- torchvision.models.resnet152(*, weights: Optional[ResNet152_Weights] = None, progress: bool = True, **kwargs: Any) ResNet [原始碼]¶
來自 用於影像辨識的深度殘差學習 的 ResNet-152。
注意
TorchVision 的瓶頸將下採樣的步幅置於第二個 3x3 卷積,而原始論文將其置於第一個 1x1 卷積。此變體提高了準確性,被稱為 ResNet V1.5。
- 參數:
weights (
ResNet152_Weights
, optional) – 要使用的預訓練權重。 有關更多詳細資訊和可能的值,請參閱下方的ResNet152_Weights
。 預設情況下,不使用任何預先訓練的權重。progress (bool, optional) – 如果為 True,則在 stderr 顯示下載的進度條。 預設為 True。
**kwargs – 傳遞到
torchvision.models.resnet.ResNet
基底類別的參數。 有關此類別的更多詳細資訊,請參閱 原始碼。
- class torchvision.models.ResNet152_Weights(value)[原始碼]¶
上述模型建構器接受下列值作為
weights
參數。ResNet152_Weights.DEFAULT
等同於ResNet152_Weights.IMAGENET1K_V2
。您也可以使用字串,例如weights='DEFAULT'
或weights='IMAGENET1K_V1'
。ResNet152_Weights.IMAGENET1K_V1:
這些權重使用簡單的訓練方法,能緊密重現論文的結果。
acc@1 (在 ImageNet-1K 上)
78.312
acc@5 (在 ImageNet-1K 上)
94.046
min_size
height=1, width=1
categories
tench, goldfish, great white shark, … (省略 997 個)
num_params
60192808
recipe
GFLOPS
11.51
File size
230.4 MB
推論轉換可在
ResNet152_Weights.IMAGENET1K_V1.transforms
中找到,並執行以下預處理操作: 接受PIL.Image
、批次(B, C, H, W)
和單個(C, H, W)
圖像torch.Tensor
物件。 圖像大小調整為resize_size=[256]
,使用interpolation=InterpolationMode.BILINEAR
,然後進行中心裁剪crop_size=[224]
。 最後,這些值首先重新縮放至[0.0, 1.0]
,然後使用mean=[0.485, 0.456, 0.406]
和std=[0.229, 0.224, 0.225]
進行標準化。ResNet152_Weights.IMAGENET1K_V2:
這些權重透過使用 TorchVision 的新的訓練方法,改進了原始論文的結果。 也可作為
ResNet152_Weights.DEFAULT
使用。acc@1 (在 ImageNet-1K 上)
82.284
acc@5 (在 ImageNet-1K 上)
96.002
min_size
height=1, width=1
categories
tench, goldfish, great white shark, … (省略 997 個)
num_params
60192808
recipe
GFLOPS
11.51
File size
230.5 MB
推論轉換可在
ResNet152_Weights.IMAGENET1K_V2.transforms
中找到,並執行以下預處理操作: 接受PIL.Image
、批次(B, C, H, W)
和單個(C, H, W)
圖像torch.Tensor
物件。 圖像大小調整為resize_size=[232]
,使用interpolation=InterpolationMode.BILINEAR
,然後進行中心裁剪crop_size=[224]
。 最後,這些值首先重新縮放至[0.0, 1.0]
,然後使用mean=[0.485, 0.456, 0.406]
和std=[0.229, 0.224, 0.225]
進行標準化。