2025 年 1 月 24 日

Intel 如何使用 PyTorch 通過 Intel Arc GPU 賦能生成式 AI

Intel 長期以來一直處於技術創新前沿,其最近進軍生成式 AI (GenAI) 解決方案也不例外。隨著 AI 驅動遊戲體驗的興起,Intel 尋求提供一種易於訪問和直觀的 GenAI 推論解決方案,該解決方案專為由 Intel 最新 GPU 提供支援的 AI PC 而定制。通過利用 PyTorch 作為開發工作的後盾,Intel 成功發布了 AI Playground,這是一個展示高級 GenAI 工作負載的開源應用程式。

閱讀更多

2025 年 1 月 21 日

使用 GemLite、TorchAO 和 SGLang 加速 LLM 推論

大型語言模型 (LLM) 通常非常耗費資源,需要大量的記憶體、運算和功率才能有效運行。量化通過將權重和激活從 16 位浮點數降低到較低的位元速率(例如,8 位、4 位、2 位)來提供解決方案,從而實現顯著的加速和記憶體節省,並且還支持更大的批次大小。

閱讀更多

2025 年 1 月 14 日

在 Intel® Xeon®處理器上加速 PyTorch 2.5 的 GenAI

此部落格是關於使用純粹的原生 PyTorch 加速生成式 AI 模型的系列文章中的第五篇。我們展示了在 Intel® Xeon®處理器上 GPTFast、Segment Anything Fast 和 Diffusion Fast 的 GenAI 加速。

閱讀更多

2025 年 1 月 09 日

通過 PyTorch 多設備支援將 Ascend 後端與 Torchtune 集成

在本部落格中,我們將簡要介紹 torchtune、Ascend 後端,並展示如何使用 torchtune 通過 Ascend 微調模型。

閱讀更多

2025 年 1 月 06 日

適用於 PyTorch 的高效能低位元運算子

我們很高興宣布在 TorchAO(PyTorch 的原生低精度函式庫)中為 Arm CPU 添加具有低位元權重(1-8 位)的嵌入運算子和具有 8 位動態量化激活和低位元權重(1-8 位)的線性運算子。這些運算子可在所有 PyTorch 介面上無縫工作,包括 eager、torch.compile、AOTI 和 ExecuTorch,並且可在 torchchat 中使用。

閱讀更多

2024 年 12 月 23 日

PyTorch 成長為 AI 和 ML 的主要開源框架:2024 年度回顧

過去的一年對於 PyTorch 來說是具有里程碑意義的一年,從主要版本到旗艦 PyTorch 大會。我們看到來自 3,500 多名個人和 3,000 個組織的貢獻呈驚人增長。可以肯定地說,PyTorch 現在已成為 AI/ML 的主要深度學習框架。根據 Linux 基金會最近的《塑造生成式 AI 的未來報告》,PyTorch 在模型訓練領域處於領先地位,採用率為 63%。

閱讀更多