オンプレミス型AIデータセンターの必要性

AIは世界中の企業にとって支配的なテクノロジーとなり、今後もそうあり続けるでしょう。幅広い業界でビジネス慣行を変革し、より良い意思決定を行うためのこのテクノロジーは、AIプロセスを実行できるサーバーへのアクセスに対する前例のない需要を生み出しています。トレーニングまたは推論フェーズ。AIインフラストラクチャは、トレーニングフェーズはコスト面で重要になる可能性があるが、ハイエンドシステム（複数のCPUとGPU）が常に最良の選択肢とは限らない。AIを実装することでトレーニング企業のデータセンター内では、組織はコストを削減すると同時に、生産性と柔軟性を向上させることができます。

クラウドメリットとデメリット

多くの組織がワークロードをパブリックに移行しているクラウドインフラストラクチャは、定義上、多くのクライアントによって共有されます。パブリックの拡張性はクラウドかなり大きい場合もあるが、ごく少数トレーニングモデルによっては、数千個のGPUが同時に動作する必要があります。パブリックで共有されているものを使用する利点は、クラウドインフラストラクチャの利点は、多数の高性能（つまり高価な）サーバーが利用可能である可能性があることです。逆に、必要なときに多数の高性能サーバーが利用できない場合もあります。さらに、大規模なデータ転送に伴うコストも考慮する必要があります。トレーニングモデルは、特にトレーニングデータは別の公開、共有からインポートする必要がありますクラウドプロバイダー。

オンプレミス環境におけるAIトレーニング

オンプレミスのデータセンター内でAIを検討し、導入する理由はいくつか存在する。

コスト– GPU搭載サーバーの導入費用は高額になる可能性があるが、長期的に見ると、パブリックな共有サーバーを利用する場合と比べてコストは低くなる可能性がある。クラウド。クラウド手数料は、特にデータ転送の場合、時間の経過とともに比較的高額になる可能性があります。さらに、高性能GPUサーバーの導入コストは、CPUやGPUが利用可能な時間の100%使用されるかどうかに関わらず、高額になる可能性があります（ただし、そのような使用率はまずあり得ません）。
パフォーマンス– CPUとGPUの組み合わせは、それぞれの数とパフォーマンスの両面で幅広く用意されています。エンタープライズAIの要件を理解する上で、CPUの数とパフォーマンス（1、2、4、または8）は非常に重要です。最新世代のCPUは16～128コアで、ベースクロック周波数は4GHzに迫ります。GPUも旧世代から最新リリースまで幅広く存在し、コア数は数千に達するものもあります。プロジェクトのCPUとGPUの要件に応じて、データセンター内で最適な構成を複数実装することが可能です。
再トレーニング– 特定のサイズと利用可能なGPUの数でモデルをトレーニングするコストを見積もる方法はいくつかありますが、多くのモデルは新しいパラメータで継続的に再トレーニングする必要があります。推論精度を向上させるには、モデルを更新されたより新しいデータで再学習させる必要があり、これには元のデータと同じくらいの時間がかかる場合があります。トレーニング使用する新しいデータの量によって異なります。オンプレミスのデータセンターでは、システムは繰り返し使用できますが、パブリッククラウド反復ごとに費用がかさみ、トレーニングモデルの。
ソフトウェア– 効率的かつ効果的なAIを作成する際には、考慮すべきソフトウェアの選択肢が数多くあります。トレーニング解決策。公共の共有クラウドプロバイダーは利用可能なコンポーネントをすべて備えていない可能性があり、パブリックで取得したインスタンスごとに追加のセットアップとテストが必要になる場合があります。クラウドインフラストラクチャー。
データ所在地と主権– 多くの業界や地域では、AIに使用されるデータの所在地に関して制限や要件が存在する可能性があります。トレーニングオンプレミスのデータセンターを使用することで、組織はこれらの規制を遵守できますが、リモートのパブリックなデータセンターを使用する場合は、クラウドデータセンターは許可されない場合があります。
セキュリティ– 多くの組織にとって、データと成果の両方のセキュリティは極めて重要です。オンプレミスのデータセンターでは、セキュリティチームがシステムやストレージデバイスへのアクセスに関して、より厳格なセキュリティポリシーを実装できます。内部プロセスやデータへのアクセスを必要とするAIを作成・使用する場合、オンプレミスのデータセンターにAIを実装することは当然の選択肢となります。
コンプライアンス– データがさまざまな規制の対象となる場合、パブリックなデータセンターを特定するよりも、準拠したオンプレミスのデータセンターを構築する方が理想的である可能性があります。クラウドこれらの規制を遵守する。

3人組Supermicro AI GPUシステム：8Uシステム、4Uシステム、5Uシステム

まとめ

効果的かつ効率的なオンプレミスAI特化型データセンターを実装するには、企業に最適なワークロードのパフォーマンス要件を理解することが不可欠です。適切に設計されたオンプレミスデータセンターは、AIの成果を得るまでの時間を短縮できます。トレーニング低遅延を実現可能推論モデルの種類に合わせて結果と意思決定を調整できます。オンプレミスのデータセンターは、企業のニーズに合わせて低コストで独自に構成できます。ワークロード、データ量、AIワークフローの微調整、およびさまざまなソフトウェアレイヤーに関する社内専門知識を理解することで、組織にとって最適なオプションを決定できます。

Supermicro AIインフラストラクチャソリューション

AI対応インフラストラクチャソリューションでAI導入を加速・簡素化しましょう。AIオンプレミスインフラストラクチャのリーディングサプライヤーとして、 Supermicroのターンキーリファレンスデザインは、世界最大規模のAIクラスターを構築してきた豊富な経験を活用しています。ソリューションは大規模からトレーニングクラスターからインテリジェントなエッジ推論ソリューションへ。

もっと詳しく知る

AIインフラストラクチャ

Data Center Building Block Solutions® (DCBBS)

AI ファクトリー

エッジAI

AIストレージ

業界別AIソリューション

NVIDIAソリューション

AMD ソリューション

インテル ソリューション

Arm AGIソリューションズ

ラックマウントサーバー

デュアルプロセッサー

シングルプロセッサー

マルチプロセッサー

GPUサーバー

8U/10U GPUライン

4U/5U GPUライン

2U GPUライン

1U GPUライン

Twin サーバー

FlexTwin™

BigTwin®

GrandTwin®

TwinPro®

FatTwin®

ブレード・サーバー

SuperBlade®

MicroBlade®

MicroCloud

ストレージ・サーバー

すべてのストレージシステム

オールフラッシュ NVMe

上部から出し入れする収納

JBOF

ペタスケール Grace ストレージ

エンタープライズ向けに最適化されたストレージ

JBODストレージエンクロージャー

マザーボード

サーバーボード

ワークステーションボード

組み込み／IoTボード

デスクトップ／ゲーミングボード

マザーボードマトリックス

グローバルSKU

筐体

1Uシャーシ

2Uシャーシ

3Uシャーシ

4U / タワーシャーシ

ミドルタワー／ミニタワー

組み込み／IoTシャーシ

移動式ラック／ドライブキット

JBODストレージエンクロージャー

グローバルSKU

SuperRack®

ラック統合サービス

アクセサリー

ケーブルマトリックス

ライザーカードマトリックス

ストレージAOCマトリックス

電源供給マトリックス

ヒートシンクマトリックス

システムファンマトリックス

移動式ラック／ドライブキット

フロントシャーシベゼル

ストレージ、I/O、セキュリティ

エッジAI およびIoTシステム

コンパクトエッジシステム

コンパクトエッジサーバー

ラックマウント型エッジサーバー

組み込みコンポーネント

組み込みマザーボード

組み込みシャーシ

スイッチ

アダプター

SuperWorkstations

液冷式AI開発プラットフォーム

シングルプロセッサ

デュアルプロセッサ

デスクトップ

インテルソリューション

クラウド仮想化

クラウドサービスプロバイダー（CSP）

IoT エッジソリューション