メインコンテンツへスキップ

オンプレミス型AIデータセンターの必要性

AIは世界中の企業にとって支配的なテクノロジーとなり、今後もそうあり続けるでしょう。幅広い業界でビジネス慣行を変革し、より良い意思決定を行うためのこのテクノロジーは、AIプロセスを実行できるサーバーへのアクセスに対する前例のない需要を生み出しています。トレーニング または推論 フェーズ。AIインフラストラクチャは、トレーニング フェーズはコスト面で重要になる可能性があるが、ハイエンドシステム(複数のCPUとGPU)が常に最良の選択肢とは限らない。AIを実装することでトレーニング 企業のデータセンター内では、組織はコストを削減すると同時に、生産性と柔軟性を向上させることができます。

クラウド メリットとデメリット

多くの組織がワークロードをパブリックに移行しているクラウド インフラストラクチャは、定義上、多くのクライアントによって共有されます。パブリックの拡張性はクラウド かなり大きい場合もあるが、ごく少数トレーニング モデルによっては、数千個のGPUが同時に動作する必要があります。パブリックで共有されているものを使用する利点は、クラウド インフラストラクチャの利点は、多数の高性能(つまり高価な)サーバーが利用可能である可能性があることです。逆に、必要なときに多数の高性能サーバーが利用できない場合もあります。さらに、大規模なデータ転送に伴うコストも考慮する必要があります。トレーニング モデルは、特にトレーニング データは別の公開、共有からインポートする必要がありますクラウド プロバイダー。

オンプレミス環境におけるAIトレーニング

オンプレミスのデータセンター内でAIを検討し、導入する理由はいくつか存在する。

  • コスト– GPU搭載サーバーの導入費用は高額になる可能性があるが、長期的に見ると、パブリックな共有サーバーを利用する場合と比べてコストは低くなる可能性がある。クラウド。クラウド 手数料は、特にデータ転送の場合、時間の経過とともに比較的高額になる可能性があります。さらに、高性能GPUサーバーの導入コストは、CPUやGPUが利用可能な時間の100%使用されるかどうかに関わらず、高額になる可能性があります(ただし、そのような使用率はまずあり得ません)。
  • パフォーマンス– CPUとGPUの組み合わせは、それぞれの数とパフォーマンスの両面で幅広く用意されています。エンタープライズAIの要件を理解する上で、CPUの数とパフォーマンス(1、2、4、または8)は非常に重要です。最新世代のCPUは16~128コアで、ベースクロック周波数は4GHzに迫ります。GPUも旧世代から最新リリースまで幅広く存在し、コア数は数千に達するものもあります。プロジェクトのCPUとGPUの要件に応じて、データセンター内で最適な構成を複数実装することが可能です。
  • 再トレーニング– 特定のサイズと利用可能なGPUの数でモデルをトレーニングするコストを見積もる方法はいくつかありますが、多くのモデルは新しいパラメータで継続的に再トレーニングする必要があります。推論 精度を向上させるには、モデルを更新されたより新しいデータで再学習させる必要があり、これには元のデータと同じくらいの時間がかかる場合があります。トレーニング 使用する新しいデータの量によって異なります。オンプレミスのデータセンターでは、システムは繰り返し使用できますが、パブリッククラウド反復ごとに費用がかさみ、トレーニング モデルの。
  • ソフトウェア– 効率的かつ効果的なAIを作成する際には、考慮すべきソフトウェアの選択肢が数多くあります。トレーニング 解決策。公共の共有クラウド プロバイダーは利用可能なコンポーネントをすべて備えていない可能性があり、パブリックで取得したインスタンスごとに追加のセットアップとテストが必要になる場合があります。クラウド インフラストラクチャー。
  • データ所在地と主権– 多くの業界や地域では、AIに使用されるデータの所在地に関して制限や要件が存在する可能性があります。トレーニング オンプレミスのデータセンターを使用することで、組織はこれらの規制を遵守できますが、リモートのパブリックなデータセンターを使用する場合は、クラウド データセンターは許可されない場合があります。
  • セキュリティ– 多くの組織にとって、データと成果の両方のセキュリティは極めて重要です。オンプレミスのデータセンターでは、セキュリティチームがシステムやストレージデバイスへのアクセスに関して、より厳格なセキュリティポリシーを実装できます。内部プロセスやデータへのアクセスを必要とするAIを作成・使用する場合、オンプレミスのデータセンターにAIを実装することは当然の選択肢となります。
  • コンプライアンス– データがさまざまな規制の対象となる場合、パブリックなデータセンターを特定するよりも、準拠したオンプレミスのデータセンターを構築する方が理想的である可能性があります。クラウド これらの規制を遵守する。
3人組Supermicro AI GPUシステム:8Uシステム、4Uシステム、5Uシステム

まとめ

効果的かつ効率的なオンプレミスAI特化型データセンターを実装するには、企業に最適なワークロードのパフォーマンス要件を理解することが不可欠です。適切に設計されたオンプレミスデータセンターは、AIの成果を得るまでの時間を短縮できます。トレーニング 低遅延を実現可能推論 モデルの種類に合わせて結果と意思決定を調整できます。オンプレミスのデータセンターは、企業のニーズに合わせて低コストで独自に構成できます。ワークロード、データ量、AIワークフローの微調整、およびさまざまなソフトウェアレイヤーに関する社内専門知識を理解することで、組織にとって最適なオプションを決定できます。