捷徑

LMHeadActorValueOperator

class torchrl.modules.tensordict_module.LMHeadActorValueOperator(*args, **kwargs)[來源]

從類似 huggingface 的*LMHeadModel 建構 Actor-Value 運算子。

此方法
  • 將類似 huggingface 的*LMHeadModel 作為輸入

  • 提取最終線性層,並將其用作 actor_head 的基礎層

    新增取樣層

  • 將通用轉換器用作通用模型

  • 新增線性評論器

參數:

base_model – 由 .transformer 模型和 .lm_head 線性層組成的 torch 模型

文件

存取 PyTorch 的全面開發者文件

檢視文件

教學課程

取得適合初學者和進階開發者的深入教學課程

檢視教學課程

資源

尋找開發資源並獲得問題解答

檢視資源