指標¶
關於指標,我們建議使用 Tensorboard 將指標記錄到雲端儲存空間,與您的模型並列。隨著模型訓練,您可以在本地端啟動 Tensorboard 實例,以監控模型進度
$ tensorboard --log-dir provider://path/to/logs
您也可以將 torchx.components.metrics.tensorboard()
元件用於您的管線。
請參閱 Trainer 範例,了解如何使用 PyTorch Lightning TensorboardLogger。
參考文獻¶
PyTorch Tensorboard Tutorial https://pytorch.dev.org.tw/tutorials/intermediate/tensorboard_tutorial.html
PyTorch Lightning Loggers https://pytorch-lightning.readthedocs.io/en/stable/extensions/logging.html
- torchx.components.metrics.tensorboard(logdir: str, image: str = 'ghcr.io/pytorch/torchx:0.7.0', timeout: float = 3600, port: int = 6006, start_on_file: str = '', exit_on_file: str = '') AppDef [來源]¶
這個元件會執行一條 Tensorboard 伺服器,這條伺服器會提供 logdir 所指定的紀錄。
由於 Tensorboard 會以服務的形式執行,因此您需要指定終止條件。這些條件包括一個逾時,以及一個選用的
exit_on_file
,這個檔案路徑一旦建立就會讓服務退出。檔案會透過 fsspec 定期進行存在的輪詢,並在建立時觸發對應的行為。
- 參數:
logdir – fsspec 路徑前往 Tensorboard 記錄
image – 要使用的圖片
timeout – 結束前要執行的最大時間 (秒)
start_on_file – 在建立 fsspec 路徑時啟動伺服器
exit_on_file – 在建立 fsspec的路徑時關閉伺服器