• 文件 >
  • TorchServe GenAI 使用案例與展示
捷徑

TorchServe GenAI 使用案例與展示

本文檔展示了 TorchServe 在 Gen AI 部署中的有趣用例。

在 AWS Graviton 上使用 Torch 編譯的 RAG 增強 LLM 服務

在此部落格中,我們展示了如何使用 TorchServe 部署 RAG 端點、使用 torch.compile 提高吞吐量並改進 Llama 端點產生的回應。我們還展示了如何使用 AWS Graviton 在 CPU 上部署 RAG 端點,同時 Llama 端點仍然部署在 GPU 上。這種基於微服務的 RAG 解決方案有效地利用了計算資源,從而為客戶節省了潛在的成本。

多影像生成 Streamlit 應用程式:使用 TorchServe、torch.compile 和 OpenVINO 鏈接 Llama 和 Stable Diffusion

此多影像生成 Streamlit 應用程式旨在根據提供的文字提示生成多個影像。此應用程式沒有直接使用 Stable Diffusion,而是鏈接 Llama 和 Stable Diffusion 以增強影像生成過程。此多影像生成用例例示了尖端 AI 技術的強大協同作用:TorchServe、OpenVINO、Torch.compile、Meta-Llama 和 Stable Diffusion。


© 版權所有 2020,PyTorch Serve 貢獻者。

使用 Sphinx 建構,主題由 theme 提供,並由 Read the Docs 提供。

文件

存取 PyTorch 的全面開發人員文件

檢視文件

教學課程

取得針對初學者和進階開發人員的深入教學課程

檢視教學課程

資源

尋找開發資源並獲得您的問題解答

檢視資源