本地部署的理由AI 資料中心
AI 已經成為並將繼續成為全球企業的主導技術。這項技術能夠改變各行各業的業務實踐,並幫助企業做出更明智的決策,從而導致對能夠執行以下操作的伺服器的需求空前高漲: AI 流程培訓或推論 階段。 AI 訓練階段所需的基礎設施成本可能很高,但高階系統(多個 CPU 和 GPU)可能不一定總是最佳選擇。透過實施AI 透過在企業資料中心內進行培訓,企業可以降低成本,同時提高生產力和靈活性。
雲端運算的優點和缺點
許多組織正在將工作負載遷移到公有雲基礎設施,顧名思義,公有雲基礎設施是由眾多客戶共享的。雖然公有雲的可擴展性可能非常強大,但很少有訓練模型需要數千個 GPU 同時運行。使用公有共用雲端基礎架構的一個好處是,可以獲得大量高階(也就是昂貴)伺服器。但另一方面,在需要時,可能無法取得大量高階伺服器。此外,大型訓練模型的資料匯入和匯出成本可能很高,尤其是在需要從其他公共共享雲端提供者匯入訓練資料的情況下。
本地部署AI 訓練
有多種原因需要考慮和實施AI 在本地資料中心內。
- 成本-雖然購置配備GPU的伺服器成本可能較高,但從長遠來看,其成本可能低於使用公有共享雲端。雲端費用隨著時間的推移可能相對較高,尤其是在資料傳輸方面。此外,購置高階GPU伺服器的成本可能很高,無論CPU或GPU是否100%利用可用時間(這種情況不太可能發生)。
- 性能——有多種CPU 以及可用的GPU組合,包括每種GPU的數量和性能。了解企業級應用AI 根據需求,CPU 的數量和效能(1、2、4 或 8 個)至關重要。最新一代 CPU 的核心數從 16 到 128 個不等,基礎時脈頻率接近 4 GHz。 GPU 也種類繁多,從老款到最新款,核心數可達數千個。資料中心可以根據專案的具體需求,實施多種最佳化配置。 CPU 以及GPU要求。
- 重新訓練-雖然有多種方法可以估算訓練特定規模和可用GPU數量的模型的成本,但許多模型需要使用新的參數來不斷重新訓練。推論 為了提高準確率,模型必須使用更新、更近期的資料進行重新訓練,而重新訓練所需的時間可能與初始訓練一樣長,具體取決於需要使用的新資料量。在本地資料中心,系統可以重複使用,而在公有雲中,每次迭代和重新訓練模型都會增加成本。
- 軟體-在創建高效且有效的系統時,有許多軟體可供選擇。 AI 培訓解決方案。公有共用雲端提供者可能不具備所有可用元件,因此在公有雲基礎架構中取得的每個執行個體可能需要額外的設定和測試。
- 資料位置和主權-對於許多行業和地區而言,資料的使用位置可能有限制和要求。 AI 培訓必須駐留在當地。企業使用本地資料中心可以遵守這些規定,而使用遠端公有雲資料中心則可能不符合規定。
- 安全性-對於許多組織而言,資料和結果的安全性都至關重要。在本地資料中心,安全團隊可以實施更嚴格的系統或儲存設備存取安全策略。創建和使用時, AI 需要存取內部流程和數據,實施AI 在本地資料中心部署顯然是最佳選擇。
- 合規性-當資料受到各種法規約束時,與尋找符合這些法規的公有雲相比,建立一個符合規定的本地資料中心可能是理想的選擇。

概括
實施高效率且有效的本地部署AI以效能為中心的資料中心需要了解最適合企業需求的工作負載的效能要求。設計合理的本地資料中心可以縮短獲得結果所需的時間。 AI 訓練功能可達到低延遲推論 根據模型類型調整結果和決策。本地資料中心可以低成本地進行獨特配置,以滿足企業的需求。了解工作負載、資料量以及微調AI 工作流程以及公司內部對各種軟體層的專業知識將有助於確定最適合該組織的選擇。
