vgg16_bn¶
- torchvision.models.vgg16_bn(*, weights: Optional[VGG16_BN_Weights] = None, progress: bool = True, **kwargs: Any) VGG [原始碼]¶
來自 用於大規模影像辨識的超深度卷積網路 的 VGG-16-BN。
- 參數:
weights (
VGG16_BN_Weights
, optional) – 要使用的預訓練權重。 有關更多詳細資訊和可能的值,請參閱下面的VGG16_BN_Weights
。 預設情況下,不使用預先訓練的權重。progress ( bool, optional) – 若為 True,則將下載進度條顯示於 stderr。預設值為 True。
**kwargs – 傳遞給
torchvision.models.vgg.VGG
基底類別的參數。請參考 原始碼 以取得更多關於此類別的詳細資訊。
- class torchvision.models.VGG16_BN_Weights(value)[來源]¶
上述模型建構器接受以下值作為
weights
參數。VGG16_BN_Weights.DEFAULT
等同於VGG16_BN_Weights.IMAGENET1K_V1
。您也可以使用字串,例如weights='DEFAULT'
或weights='IMAGENET1K_V1'
。VGG16_BN_Weights.IMAGENET1K_V1:
這些權重是透過使用簡化的訓練配方從頭開始訓練的。 也可作為
VGG16_BN_Weights.DEFAULT
使用。acc@1 (在 ImageNet-1K 上)
73.36
acc@5 (在 ImageNet-1K 上)
91.516
min_size
height=32, width=32
categories
tench, goldfish, great white shark, … (省略 997)
recipe
num_params
138365992
GFLOPS
15.47
File size
527.9 MB
推論轉換可在
VGG16_BN_Weights.IMAGENET1K_V1.transforms
中取得,並執行以下預處理操作: 接受PIL.Image
、批次化的(B, C, H, W)
和單一的(C, H, W)
影像torch.Tensor
物件。 影像會使用interpolation=InterpolationMode.BILINEAR
調整大小為resize_size=[256]
,然後進行crop_size=[224]
的中心裁剪。 最後,這些值會先重新縮放為[0.0, 1.0]
,然後使用mean=[0.485, 0.456, 0.406]
和std=[0.229, 0.224, 0.225]
進行正規化。