クラウド アーキテクチャを構築し、高性能 AI システムも設計している場合、何を変える必要がありますか?これを行うには何が必要ですか?新たなベストプラクティスは何ですか?私の提案は次のとおりです: ユースケースを知るクラウド アーキテクチャにおける AIGC の目標を明確に定義します。私が繰り返し目にする間違いがあるとすれば、それはビジネス システムにおける AIGC の意味を理解していないことです。コンテンツ生成、レコメンデーション システム、その他のアプリケーションなど、目標が何であるかを理解します。 これは、物事を書き留め、目標とその達成方法について合意を得ること、そして最も重要なことに、成功をどのように定義するかを意味します。これは AIGC に限ったことではありません。これは、クラウドで構築されるすべての移行と新しいシステムにとって成功へのステップです。 ビジネスのユースケースを十分に理解していなかったために、クラウドでの AIGC プロジェクト全体が失敗するのを見たことがあります。企業が何かクールなものを作っても、それがビジネスに何の価値も追加しないのは意味がありません。 データのソースと品質が鍵AIGC モデルによるトレーニングと推論に必要なデータ ソースを特定します。データはアクセス可能で、高品質であり、慎重に管理されている必要があります。また、クラウド ストレージ ソリューションの可用性と互換性も確保する必要があります。 AIGC システムは高度にデータ中心です。私はこれをデータ指向システムと呼んでいます。データは AIGC システムの成果を推進する原動力です。ゴミを入れればゴミが出る。 したがって、データ アクセス可能性をクラウド アーキテクチャの主な推進力にするのに役立ちます。トレーニング データとして関連するデータのほとんどにアクセスする必要がありますが、通常は、単一の物理エンティティに移行するのではなく、存在する場所に保持します。そうしないと、データが冗長化し、真実の唯一の情報源がなくなることになります。データを AI モデルに取り込む前に、効率的なデータ パイプラインを使用してデータを前処理およびクリーンアップすることを検討してください。これにより、データの品質とモデルのパフォーマンスが保証されます。 これは、AIGC を使用したクラウド アーキテクチャの成功の約 80% です。ただし、クラウド アーキテクトはこれらのシステムにデータを提供するよりも AIGC システムの処理に重点を置いているため、この点はほとんど見過ごされてしまいます。データがすべてです。 データセキュリティとプライバシーデータが重要であるのと同様に、そのデータに適用されるセキュリティとプライバシーも重要です。 AIGC 処理により、一見無意味なデータが機密情報を明らかにする可能性のあるデータに変換される可能性があります。 少なくとも関連するデータ プライバシー規制に準拠するために、AIGC が使用する機密データと AIGC が生成する可能性のある新しいデータを保護するために、強力なデータ セキュリティ対策、暗号化、およびアクセス制御を実装します。これは、最後のステップとして特定のセキュリティ システムをアーキテクチャに組み込むことを意味するものではありません。セキュリティはシステムのあらゆるステップに組み込む必要があります。 スケーラビリティと推論リソースさまざまなワークロードとデータ処理のニーズに対応できるように、スケーラブルなクラウド リソースを計画します。ほとんどの企業は、自動スケーリングと負荷分散のソリューションを検討しています。私が見ている重大な間違いは、大規模だが高価なシステムを構築することです。スケーラビリティとコスト効率のバランスを取ることが最善ですが、これは可能ですが、優れたアーキテクチャと FinOps プラクティスが必要です。 さらに、トレーニングおよび推論リソースも検討する必要があります。クラウド カンファレンスでのニュースの多くがこのテーマを中心に展開されていたことにお気づきだと思いますが、それには十分な理由があります。モデルのトレーニングと推論には、GPU または TPU を備えた適切なクラウド インスタンスを選択します。ここでも、コスト効率を実現するためにリソースの割り当てを最適化します。 モデル選択を検討する代表的な AIGC アーキテクチャ (一般的な敵対的ネットワーク、トランスフォーマーなど) を選択します。特定のユースケースとニーズに基づきます。 AWS SageMaker などのクラウド サービスをモデル トレーニングに使用することを検討し、最適化されたソリューションを見つけます。これは、相互に接続されたモデルが多数存在する可能性があり、これが標準となることを理解することも意味します。 バージョン管理やコンテナ化などの強力なモデル展開戦略を実装して、クラウド アーキテクチャ内のアプリケーションやサービスが AI モデルにアクセスできるようにします。 監視とログ記録AI モデルのパフォーマンス、リソース使用率、潜在的な問題を追跡するための監視およびログ記録システムの設定は必須です。クラウドで AIGC を処理するために構築された異常アラート メカニズムと観測可能性システムを確立します。 さらに、AIGC はリソースを大量に消費する可能性があるため、クラウド リソース コストを継続的に監視して最適化します。クラウド コスト管理ツールとプラクティスを使用します。これは、FinOps がデプロイメントのあらゆる側面を監視し、少なくとも運用コストの効率性とアーキテクチャの効率を改善して、アーキテクチャが最適かどうかを評価する必要があることを意味します。ほとんどのアーキテクチャでは調整と継続的な改善が必要です。 その他の考慮事項高可用性を確保するにはフェイルオーバーと冗長性が必要であり、災害復旧計画により、必要に応じて冗長性を実装することで、システム障害が発生した場合のダウンタイムとデータ損失を最小限に抑えることができます。さらに、クラウド インフラストラクチャ内の AIGC システムのセキュリティを定期的に監査および評価して、ギャップを解消し、コンプライアンスを維持します。 特に、ユーザーに影響を与えるコンテンツを生成したり、決定を下したりする場合には、AI の倫理的な使用に関するガイドラインを確立することをお勧めします。偏見と公平性の問題に関しては、現在 AI と公平性に関する訴訟が起こっており、正しいことを行っているかどうかを確認する必要があります。 AI によって生成されたコンテンツがユーザーの期待に応え、エンゲージメントを強化できるように、ユーザー エクスペリエンスを継続的に評価します。 AIGC を使用するかどうかにかかわらず、クラウド コンピューティング アーキテクチャの他の側面は同様です。重要なのは、いくつかの事柄の方がはるかに重要であり、より厳密さが求められ、常に改善の余地があることを認識することです。 |
<<: ゲーム業界の幹部が語る: クラウド サービスを活用してゲーマーの関心を維持する方法
>>: ハイブリッドクラウドでエッジコンピューティングを最適化する3つの方法
過去 10 年間で、テクノロジー業界では企業がデータを処理する方法に大きな変化が見られました。オンプ...
著者はDoubanのファンであり、著者と同様にDoubanが好きで、Doubanに注目しているウェブ...
今年の SEO の核心テーマは、ユーザー エクスペリエンスとユーザーのニーズです。検索エンジンのアル...
2020年は特別な年になる運命にあります。 COVID-19パンデミックが2四半期続く中、世界経済は...
今年6月に運営を始めたウェブサイトがあります。9月にはtoolz上のBaiduウェイトが4に達しまし...
SEO 担当者は皆 H1 タグを知っており、基本的に主流の検索エンジンは H1 タグ内のテキスト情報...
これまでの製品発表と同様に、羅永浩のエイプリルフールの最初のライブストリーミング番組はさまざまな分野...
IDC Review Network (idcps.com) は 4 月 22 日に次のように報告し...
クラウド コンピューティングでは、ローカル コンピューターやリモート サーバーではなく、多数の分散コ...
6月28日はウェブマスターにとって暗黒の日でした。大量のウェブサイトがBaiduのデータベースから追...
最近、プロジェクトに簡単な分散リクエスト追跡機能を追加したいと考えています。フロントエンドからゲート...
最近、Googleの親会社であるAlphabetが初めてGoogleのクラウドコンピューティング事業...
オンラインクレーンゲームの対外貿易マーケティングを行うにはどうすればいいですか?もちろん、YouTu...
多くの人が私に尋ねます。最適化の面で Google と Baidu の違いは何ですか? 私だけではな...
racknerd は、16 個の C セグメント、1Gbps の帯域幅へのアクセスを提供し、ほぼすべ...