捷徑

指標

關於指標,我們建議使用 Tensorboard 將指標記錄到雲端儲存空間,與您的模型並列。隨著模型訓練,您可以在本地端啟動 Tensorboard 實例,以監控模型進度

$ tensorboard --log-dir provider://path/to/logs

您也可以將 torchx.components.metrics.tensorboard() 元件用於您的管線。

請參閱 Trainer 範例,了解如何使用 PyTorch Lightning TensorboardLogger。

參考文獻

torchx.components.metrics.tensorboard(logdir: str, image: str = 'ghcr.io/pytorch/torchx:0.7.0', timeout: float = 3600, port: int = 6006, start_on_file: str = '', exit_on_file: str = '') AppDef[來源]

這個元件會執行一條 Tensorboard 伺服器,這條伺服器會提供 logdir 所指定的紀錄。

由於 Tensorboard 會以服務的形式執行,因此您需要指定終止條件。這些條件包括一個逾時,以及一個選用的 exit_on_file,這個檔案路徑一旦建立就會讓服務退出。

檔案會透過 fsspec 定期進行存在的輪詢,並在建立時觸發對應的行為。

參數:
  • logdir – fsspec 路徑前往 Tensorboard 記錄

  • image – 要使用的圖片

  • timeout – 結束前要執行的最大時間 (秒)

  • start_on_file – 在建立 fsspec 路徑時啟動伺服器

  • exit_on_file – 在建立 fsspec的路徑時關閉伺服器

文件

取得 PyTorch 的完整開發人員文件

查看文件

教學

取得新手及進階開發人員的深入教學

查看教學

資源

尋找開發資源並取得問題的解答

查看資源