torch.nn.functional.gumbel_softmax¶
- torch.nn.functional.gumbel_softmax(logits, tau=1, hard=False, eps=1e-10, dim=-1)[來源][來源]¶
從 Gumbel-Softmax 分佈中取樣 (連結 1 連結 2),並可選擇進行離散化。
- 參數
- 回傳值
從 Gumbel-Softmax 分佈取樣的 Tensor,形狀與 logits 相同。 如果
hard=True
,則回傳的樣本將為 one-hot 向量,否則它們將為機率分佈,其總和在 dim 維度上為 1。- 回傳類型
注意
此函式在此僅為相容舊版程式碼,未來可能會從 nn.Functional 中移除。
注意
hard 的主要技巧是執行 y_hard - y_soft.detach() + y_soft
它實現了兩件事:- 使輸出值完全 one-hot(因為我們先加上然後減去 y_soft 值)- 使梯度等於 y_soft 梯度(因為我們剝離了所有其他梯度)
- 範例:
>>> logits = torch.randn(20, 32) >>> # Sample soft categorical using reparametrization trick: >>> F.gumbel_softmax(logits, tau=1, hard=False) >>> # Sample hard categorical using "Straight-through" trick: >>> F.gumbel_softmax(logits, tau=1, hard=True)