torch.matmul¶
- torch.matmul(input, other, *, out=None) Tensor ¶
兩個張量的矩陣乘積。
行為取決於張量的維度,如下所示
如果兩個張量都是一維的,則傳回點積(純量)。
如果兩個引數都是二維的,則會回傳矩陣與矩陣的乘積。
如果第一個引數是一維的,而第二個引數是二維的,為了進行矩陣相乘,會在第一個引數的維度前加上 1。矩陣相乘後,會移除這個前置的維度。
如果第一個引數是二維的,而第二個引數是一維的,則會回傳矩陣與向量的乘積。
如果兩個引數至少都是一維的,且至少有一個引數是 N 維的(其中 N > 2),則會回傳批次矩陣乘積。如果第一個引數是一維的,為了進行批次矩陣相乘,會在它的維度前加上 1,並在計算後移除。如果第二個引數是一維的,為了進行批次矩陣相乘,會在它的維度後加上 1,並在計算後移除。非矩陣(即批次)維度會進行廣播(因此必須是可以廣播的)。例如,如果
input
是一個 張量,而other
是一個 張量,則out
將會是一個 張量。請注意,廣播邏輯在判斷輸入是否可以廣播時,只會查看批次維度,而不會查看矩陣維度。例如,如果
input
是一個 張量,而other
是一個 張量,即使最後兩個維度(即矩陣維度)不同,這些輸入也可以進行廣播。out
將會是一個 張量。
此操作支援帶有稀疏佈局的引數。 特別是,矩陣-矩陣 (兩個引數都是二維的) 支援稀疏引數,其限制與
torch.mm()
相同。警告
稀疏支援是一個 Beta 功能,某些佈局/dtype/裝置組合可能不受支援,或者可能不支援自動微分。如果您注意到缺少功能,請開啟一個功能請求。
此運算子支援 TensorFloat32。
在某些 ROCm 裝置上,當使用 float16 輸入時,此模組將對向後傳播使用不同的精度。
注意
此函數的一維點積版本不支援
out
參數。範例
>>> # vector x vector >>> tensor1 = torch.randn(3) >>> tensor2 = torch.randn(3) >>> torch.matmul(tensor1, tensor2).size() torch.Size([]) >>> # matrix x vector >>> tensor1 = torch.randn(3, 4) >>> tensor2 = torch.randn(4) >>> torch.matmul(tensor1, tensor2).size() torch.Size([3]) >>> # batched matrix x broadcasted vector >>> tensor1 = torch.randn(10, 3, 4) >>> tensor2 = torch.randn(4) >>> torch.matmul(tensor1, tensor2).size() torch.Size([10, 3]) >>> # batched matrix x batched matrix >>> tensor1 = torch.randn(10, 3, 4) >>> tensor2 = torch.randn(10, 4, 5) >>> torch.matmul(tensor1, tensor2).size() torch.Size([10, 3, 5]) >>> # batched matrix x broadcasted matrix >>> tensor1 = torch.randn(10, 3, 4) >>> tensor2 = torch.randn(4, 5) >>> torch.matmul(tensor1, tensor2).size() torch.Size([10, 3, 5])