快捷鍵

torch.nn.functional.gelu

torch.nn.functional.gelu(input, approximate='none') Tensor

當 approximate 參數為 ‘none’ 時,它會逐元素地應用函數 GELU(x)=xΦ(x)\text{GELU}(x) = x * \Phi(x)

其中 Φ(x)\Phi(x) 是高斯分佈的累積分佈函數。

當 approximate 參數為 ‘tanh’ 時,Gelu 使用以下公式估算:

GELU(x)=0.5x(1+Tanh(2/π(x+0.044715x3)))\text{GELU}(x) = 0.5 * x * (1 + \text{Tanh}(\sqrt{2 / \pi} * (x + 0.044715 * x^3)))

請參閱 Gaussian Error Linear Units (GELUs)

文件

取得 PyTorch 的完整開發者文件

檢視文件

教學

取得針對初學者和進階開發者的深入教學

檢視教學

資源

尋找開發資源並取得問題解答

檢視資源