運算子¶
torchvision.ops
實現了特定於電腦視覺的運算子、損失函數和層。
注意
所有運算子都原生支援 TorchScript。
檢測和分割運算子¶
以下運算子執行物件檢測和分割模型中所需的前處理和後處理。
|
以批次方式執行非最大抑制。 |
|
計算所提供遮罩周圍的邊界框。 |
|
根據框的交集覆蓋率 (IoU) 對框執行非最大抑制 (NMS)。 |
|
執行感興趣區域 (RoI) 對齊運算子,使用平均池化,如 Mask R-CNN 中所述。 |
|
執行 Fast R-CNN 中描述的感興趣區域 (RoI) 池化運算子 |
|
執行 Light-Head R-CNN 中提到的位置敏感感興趣區域 (RoI) 對齊運算子。 |
|
執行 R-FCN 中描述的位置敏感感興趣區域 (RoI) 池化運算子 |
|
從一組特徵圖的頂部新增 FPN 的模組。 |
|
多尺度 RoIAlign 池化,適用於使用或不使用 FPN 的檢測。 |
|
參見 |
|
請參閱 |
|
請參閱 |
|
請參閱 |
框運算子¶
這些實用函式可對邊界框執行各種運算。
|
計算一組邊界框的面積,這些邊界框由其 (x1, y1, x2, y2) 座標指定。 |
|
將 |
|
傳回兩組框之間的交集覆蓋率(Jaccard 指數)。 |
|
裁剪框,使其位於 |
|
傳回兩組框之間的完整交集覆蓋率(Jaccard 指數)。 |
|
傳回兩組框之間的距離交集覆蓋率(Jaccard 指數)。 |
|
傳回兩組框之間的廣義交集覆蓋率(Jaccard 指數)。 |
|
從 |
損失函數¶
已實作以下視覺特定損失函數
|
梯度友善的 IoU 損失,具有額外的懲罰項,當框不重疊時,該懲罰項不為零。 |
|
梯度友善的 IoU 損失,具有額外的懲罰項,當框中心之間的距離不為零時,該懲罰項不為零。 |
|
梯度友善的 IoU 損失,具有額外的懲罰項,當框不重疊且按其最小封閉框的大小縮放時,該懲罰項不為零。 |
|
RetinaNet 中用於密集檢測的損失函數:https://arxiv.org/abs/1708.02002。 |
層¶
TorchVision 提供常用的建構區塊作為層
|
用於 Convolution2d-Normalization-Activation 區塊的可配置區塊。 |
|
用於 Convolution3d-Normalization-Activation 區塊的可配置區塊。 |
|
請參閱 |
|
請參閱 |
|
請參閱 |
|
BatchNorm2d,其中批次統計資料和仿射參數是固定的 |
|
此區塊實作多層感知器 (MLP) 模組。 |
|
此模組傳回張量輸入的檢視,其維度已重新排列。 |
|
此區塊實作了來自 https://arxiv.org/abs/1709.01507 的 Squeeze-and-Excitation 區塊(見圖)。 |
|
請參閱 |
|
執行 Deformable Convolution v2,描述於 Deformable ConvNets v2: More Deformable, Better Results,如果 |
|
實作來自 "DropBlock: A regularization method for convolutional networks" <https://arxiv.org/abs/1810.12890> 的 DropBlock2d。 |
|
實作來自 "DropBlock: A regularization method for convolutional networks" <https://arxiv.org/abs/1810.12890> 的 DropBlock3d。 |
|
實作來自 "Deep Networks with Stochastic Depth" 的 Stochastic Depth,用於隨機捨棄殘差架構的殘差分支。 |