AIGCシステムの導入により、企業のクラウドアーキテクチャが変化する可能性がある

クラウドアーキテクチャを構築し、高性能 AI システムも設計している場合、何を変える必要がありますか?これを行うには何が必要ですか?新たなベストプラクティスは何ですか?私の提案は次のとおりです:

ユースケースを知る

クラウドアーキテクチャにおける AIGC の目標を明確に定義します。私が繰り返し目にする間違いがあるとすれば、それはビジネスシステムにおける AIGC の意味を理解していないことです。コンテンツ生成、レコメンデーションシステム、その他のアプリケーションなど、目標が何であるかを理解します。

これは、物事を書き留め、目標とその達成方法について合意を得ること、そして最も重要なことに、成功をどのように定義するかを意味します。これは AIGC に限ったことではありません。これは、クラウドで構築されるすべての移行と新しいシステムにとって成功へのステップです。

ビジネスのユースケースを十分に理解していなかったために、クラウドでの AIGC プロジェクト全体が失敗するのを見たことがあります。企業が何かクールなものを作っても、それがビジネスに何の価値も追加しないのは意味がありません。

データのソースと品質が鍵

AIGC モデルによるトレーニングと推論に必要なデータソースを特定します。データはアクセス可能で、高品質であり、慎重に管理されている必要があります。また、クラウドストレージソリューションの可用性と互換性も確保する必要があります。

AIGC システムは高度にデータ中心です。私はこれをデータ指向システムと呼んでいます。データは AIGC システムの成果を推進する原動力です。ゴミを入れればゴミが出る。

したがって、データアクセス可能性をクラウドアーキテクチャの主な推進力にするのに役立ちます。トレーニングデータとして関連するデータのほとんどにアクセスする必要がありますが、通常は、単一の物理エンティティに移行するのではなく、存在する場所に保持します。そうしないと、データが冗長化し、真実の唯一の情報源がなくなることになります。データを AI モデルに取り込む前に、効率的なデータパイプラインを使用してデータを前処理およびクリーンアップすることを検討してください。これにより、データの品質とモデルのパフォーマンスが保証されます。

これは、AIGC を使用したクラウドアーキテクチャの成功の約 80% です。ただし、クラウドアーキテクトはこれらのシステムにデータを提供するよりも AIGC システムの処理に重点を置いているため、この点はほとんど見過ごされてしまいます。データがすべてです。

データセキュリティとプライバシー

データが重要であるのと同様に、そのデータに適用されるセキュリティとプライバシーも重要です。 AIGC 処理により、一見無意味なデータが機密情報を明らかにする可能性のあるデータに変換される可能性があります。

少なくとも関連するデータプライバシー規制に準拠するために、AIGC が使用する機密データと AIGC が生成する可能性のある新しいデータを保護するために、強力なデータセキュリティ対策、暗号化、およびアクセス制御を実装します。これは、最後のステップとして特定のセキュリティシステムをアーキテクチャに組み込むことを意味するものではありません。セキュリティはシステムのあらゆるステップに組み込む必要があります。

スケーラビリティと推論リソース

さまざまなワークロードとデータ処理のニーズに対応できるように、スケーラブルなクラウドリソースを計画します。ほとんどの企業は、自動スケーリングと負荷分散のソリューションを検討しています。私が見ている重大な間違いは、大規模だが高価なシステムを構築することです。スケーラビリティとコスト効率のバランスを取ることが最善ですが、これは可能ですが、優れたアーキテクチャと FinOps プラクティスが必要です。

さらに、トレーニングおよび推論リソースも検討する必要があります。クラウドカンファレンスでのニュースの多くがこのテーマを中心に展開されていたことにお気づきだと思いますが、それには十分な理由があります。モデルのトレーニングと推論には、GPU または TPU を備えた適切なクラウドインスタンスを選択します。ここでも、コスト効率を実現するためにリソースの割り当てを最適化します。

モデル選択を検討する

代表的な AIGC アーキテクチャ (一般的な敵対的ネットワーク、トランスフォーマーなど) を選択します。特定のユースケースとニーズに基づきます。 AWS SageMaker などのクラウドサービスをモデルトレーニングに使用することを検討し、最適化されたソリューションを見つけます。これは、相互に接続されたモデルが多数存在する可能性があり、これが標準となることを理解することも意味します。

バージョン管理やコンテナ化などの強力なモデル展開戦略を実装して、クラウドアーキテクチャ内のアプリケーションやサービスが AI モデルにアクセスできるようにします。

監視とログ記録

AI モデルのパフォーマンス、リソース使用率、潜在的な問題を追跡するための監視およびログ記録システムの設定は必須です。クラウドで AIGC を処理するために構築された異常アラートメカニズムと観測可能性システムを確立します。

さらに、AIGC はリソースを大量に消費する可能性があるため、クラウドリソースコストを継続的に監視して最適化します。クラウドコスト管理ツールとプラクティスを使用します。これは、FinOps がデプロイメントのあらゆる側面を監視し、少なくとも運用コストの効率性とアーキテクチャの効率を改善して、アーキテクチャが最適かどうかを評価する必要があることを意味します。ほとんどのアーキテクチャでは調整と継続的な改善が必要です。

その他の考慮事項

高可用性を確保するにはフェイルオーバーと冗長性が必要であり、災害復旧計画により、必要に応じて冗長性を実装することで、システム障害が発生した場合のダウンタイムとデータ損失を最小限に抑えることができます。さらに、クラウドインフラストラクチャ内の AIGC システムのセキュリティを定期的に監査および評価して、ギャップを解消し、コンプライアンスを維持します。

特に、ユーザーに影響を与えるコンテンツを生成したり、決定を下したりする場合には、AI の倫理的な使用に関するガイドラインを確立することをお勧めします。偏見と公平性の問題に関しては、現在 AI と公平性に関する訴訟が起こっており、正しいことを行っているかどうかを確認する必要があります。 AI によって生成されたコンテンツがユーザーの期待に応え、エンゲージメントを強化できるように、ユーザーエクスペリエンスを継続的に評価します。

AIGC を使用するかどうかにかかわらず、クラウドコンピューティングアーキテクチャの他の側面は同様です。重要なのは、いくつかの事柄の方がはるかに重要であり、より厳密さが求められ、常に改善の余地があることを認識することです。

<<: ゲーム業界の幹部が語る: クラウドサービスを活用してゲーマーの関心を維持する方法

>>: ハイブリッドクラウドでエッジコンピューティングを最適化する3つの方法