Video ResNet¶
VideoResNet 模型基於 A Closer Look at Spatiotemporal Convolutions for Action Recognition 論文。
警告
影片模組處於 Beta 階段,不保證向後相容性。
模型建構器¶
以下模型建構器可用於實例化 VideoResNet 模型,無論有無預先訓練的權重。所有模型建構器在內部都依賴於 torchvision.models.video.resnet.VideoResNet
基礎類別。請參考 原始碼 以取得關於此類別的更多詳細資訊。
|
建構 18 層 Resnet3D 模型。 |
|
建構 18 層混合卷積網路,如 |
|
建構 18 層深度 R(2+1)D 網路,如 |