熱身：numpy¶

建立於：2020 年 12 月 03 日 | 最後更新：2020 年 12 月 03 日 | 最後驗證：2024 年 11 月 05 日

一個三階多項式，經過訓練，透過最小化平方歐幾里德距離，從 \(-\pi\) 到 \(pi\) 預測 \(y=\sin(x)\)。

此實作使用 numpy 手動計算前向傳播、損失和反向傳播。

numpy 陣列是一個通用的 n 維陣列；它不了解深度學習或梯度或計算圖，而只是一種執行通用數值計算的方法。

1546.0365145892183
1095.8992907857576
777.6096767345516
552.5352611528602
393.3692169177716
280.80664270842703
201.19883404382793
144.89548639133625
105.07298180275444
76.90616893555887
56.982896477615675
42.89011969702015
32.9212810307606
25.869417918780947
20.880874497663395
17.35185928109817
14.855296144964393
13.08909475122299
11.839566794279794
10.955552494109163
Result: y = 0.04887728059779718 + 0.854335392917212 x + -0.008432144224579809 x^2 + -0.09298823470267067 x^3

import numpy as np
import math

# Create random input and output data
x = np.linspace(-math.pi, math.pi, 2000)
y = np.sin(x)

# Randomly initialize weights
a = np.random.randn()
b = np.random.randn()
c = np.random.randn()
d = np.random.randn()

learning_rate = 1e-6
for t in range(2000):
    # Forward pass: compute predicted y
    # y = a + b x + c x^2 + d x^3
    y_pred = a + b * x + c * x ** 2 + d * x ** 3

    # Compute and print loss
    loss = np.square(y_pred - y).sum()
    if t % 100 == 99:
        print(t, loss)

    # Backprop to compute gradients of a, b, c, d with respect to loss
    grad_y_pred = 2.0 * (y_pred - y)
    grad_a = grad_y_pred.sum()
    grad_b = (grad_y_pred * x).sum()
    grad_c = (grad_y_pred * x ** 2).sum()
    grad_d = (grad_y_pred * x ** 3).sum()

    # Update weights
    a -= learning_rate * grad_a
    b -= learning_rate * grad_b
    c -= learning_rate * grad_c
    d -= learning_rate * grad_d

print(f'Result: y = {a} + {b} x + {c} x^2 + {d} x^3')

腳本的總執行時間： (0 分鐘 0.359 秒)

由 Sphinx-Gallery 產生

熱身：numpy¶

文件

教學

資源