了解 TPU¶
Google Cloud TPU 是客製化設計的 AI 加速器,針對大型 AI 模型的訓練和推論進行了最佳化。它們非常適合各種使用案例,例如聊天機器人、程式碼產生、媒體內容產生、合成語音、視覺服務、推薦引擎、個人化模型等等。
Cloud TPU 旨在針對各種 AI 工作負載進行成本效益高的擴充,涵蓋訓練、微調和推論。Cloud TPU 提供多功能性,可加速領先 AI 框架(包括 PyTorch、JAX 和 TensorFlow)上的工作負載。透過 Google Kubernetes Engine (GKE) 中的 Cloud TPU 整合,無縫協調大規模 AI 工作負載。利用動態工作負載排程器,透過同時排程所有需要的加速器來提高工作負載的可擴充性。尋找開發 AI 模型最簡單方法的客戶也可以在全受管 AI 平台 Vertex AI 中利用 Cloud TPU。
如需更多資訊,請參閱