快速鍵

vgg16_bn

torchvision.models.vgg16_bn(*, weights: Optional[VGG16_BN_Weights] = None, progress: bool = True, **kwargs: Any) VGG[原始碼]

來自 用於大規模影像辨識的超深度卷積網路 的 VGG-16-BN。

參數:
  • weights (VGG16_BN_Weights, optional) – 要使用的預訓練權重。 有關更多詳細資訊和可能的值,請參閱下面的 VGG16_BN_Weights。 預設情況下,不使用預先訓練的權重。

  • progress ( bool, optional) – 若為 True,則將下載進度條顯示於 stderr。預設值為 True。

  • **kwargs – 傳遞給 torchvision.models.vgg.VGG 基底類別的參數。請參考 原始碼 以取得更多關於此類別的詳細資訊。

class torchvision.models.VGG16_BN_Weights(value)[來源]

上述模型建構器接受以下值作為 weights 參數。VGG16_BN_Weights.DEFAULT 等同於 VGG16_BN_Weights.IMAGENET1K_V1。您也可以使用字串,例如 weights='DEFAULT'weights='IMAGENET1K_V1'

VGG16_BN_Weights.IMAGENET1K_V1:

這些權重是透過使用簡化的訓練配方從頭開始訓練的。 也可作為 VGG16_BN_Weights.DEFAULT 使用。

acc@1 (在 ImageNet-1K 上)

73.36

acc@5 (在 ImageNet-1K 上)

91.516

min_size

height=32, width=32

categories

tench, goldfish, great white shark, … (省略 997)

recipe

link

num_params

138365992

GFLOPS

15.47

File size

527.9 MB

推論轉換可在 VGG16_BN_Weights.IMAGENET1K_V1.transforms 中取得,並執行以下預處理操作: 接受 PIL.Image、批次化的 (B, C, H, W) 和單一的 (C, H, W) 影像 torch.Tensor 物件。 影像會使用 interpolation=InterpolationMode.BILINEAR 調整大小為 resize_size=[256],然後進行 crop_size=[224] 的中心裁剪。 最後,這些值會先重新縮放為 [0.0, 1.0],然後使用 mean=[0.485, 0.456, 0.406]std=[0.229, 0.224, 0.225] 進行正規化。

文件

存取 PyTorch 的完整開發者文件

檢視文件

教學

取得針對初學者和進階開發者的深入教學

檢視教學

資源

尋找開發資源並取得問題解答

檢視資源