AIGCシステムの導入により、企業のクラウドアーキテクチャが変化する可能性がある

AIGCシステムの導入により、企業のクラウドアーキテクチャが変化する可能性がある

クラウド アーキテクチャを構築し、高性能 AI システムも設計している場合、何を変える必要がありますか?これを行うには何が必要ですか?新たなベストプラクティスは何ですか?私の提案は次のとおりです:

ユースケースを知る

クラウド アーキテクチャにおける AIGC の目標を明確に定義します。私が繰り返し目にする間違いがあるとすれば、それはビジネス システムにおける AIGC の意味を理解していないことです。コンテンツ生成、レコメンデーション システム、その他のアプリケーションなど、目標が何であるかを理解します。

これは、物事を書き留め、目標とその達成方法について合意を得ること、そして最も重要なことに、成功をどのように定義するかを意味します。これは AIGC に限ったことではありません。これは、クラウドで構築されるすべての移行と新しいシステムにとって成功へのステップです。

ビジネスのユースケースを十分に理解していなかったために、クラウドでの AIGC プロジェクト全体が失敗するのを見たことがあります。企業が何かクールなものを作っても、それがビジネスに何の価値も追加しないのは意味がありません。

データのソースと品質が鍵

AIGC モデルによるトレーニングと推論に必要なデータ ソースを特定します。データはアクセス可能で、高品質であり、慎重に管理されている必要があります。また、クラウド ストレージ ソリューションの可用性と互換性も確保する必要があります。

AIGC システムは高度にデータ中心です。私はこれをデータ指向システムと呼んでいます。データは AIGC システムの成果を推進する原動力です。ゴミを入れればゴミが出る。

したがって、データ アクセス可能性をクラウド アーキテクチャの主な推進力にするのに役立ちます。トレーニング データとして関連するデータのほとんどにアクセスする必要がありますが、通常は、単一の物理エンティティに移行するのではなく、存在する場所に保持します。そうしないと、データが冗長化し、真実の唯一の情報源がなくなることになります。データを AI モデルに取り込む前に、効率的なデータ パイプラインを使用してデータを前処理およびクリーンアップすることを検討してください。これにより、データの品質とモデルのパフォーマンスが保証されます。

これは、AIGC を使用したクラウド アーキテクチャの成功の約 80% です。ただし、クラウド アーキテクトはこれらのシステムにデータを提供するよりも AIGC システムの処理に重点を置いているため、この点はほとんど見過ごされてしまいます。データがすべてです。

データセキュリティとプライバシー

データが重要であるのと同様に、そのデータに適用されるセキュリティとプライバシーも重要です。 AIGC 処理により、一見無意味なデータが機密情報を明らかにする可能性のあるデータに変換される可能性があります。

少なくとも関連するデータ プライバシー規制に準拠するために、AIGC が使用する機密データと AIGC が生成する可能性のある新しいデータを保護するために、強力なデータ セキュリティ対策、暗号化、およびアクセス制御を実装します。これは、最後のステップとして特定のセキュリティ システムをアーキテクチャに組み込むことを意味するものではありません。セキュリティはシステムのあらゆるステップに組み込む必要があります。

スケーラビリティと推論リソース

さまざまなワークロードとデータ処理のニーズに対応できるように、スケーラブルなクラウド リソースを計画します。ほとんどの企業は、自動スケーリングと負荷分散のソリューションを検討しています。私が見ている重大な間違いは、大規模だが高価なシステムを構築することです。スケーラビリティとコスト効率のバランスを取ることが最善ですが、これは可能ですが、優れたアーキテクチャと FinOps プラクティスが必要です。

さらに、トレーニングおよび推論リソースも検討する必要があります。クラウド カンファレンスでのニュースの多くがこのテーマを中心に展開されていたことにお気づきだと思いますが、それには十分な理由があります。モデルのトレーニングと推論には、GPU または TPU を備えた適切なクラウド インスタンスを選択します。ここでも、コスト効率を実現するためにリソースの割り当てを最適化します。

モデル選択を検討する

代表的な AIGC アーキテクチャ (一般的な敵対的ネットワーク、トランスフォーマーなど) を選択します。特定のユースケースとニーズに基づきます。 AWS SageMaker などのクラウド サービスをモデル トレーニングに使用することを検討し、最適化されたソリューションを見つけます。これは、相互に接続されたモデルが多数存在する可能性があり、これが標準となることを理解することも意味します。

バージョン管理やコンテナ化などの強力なモデル展開戦略を実装して、クラウド アーキテクチャ内のアプリケーションやサービスが AI モデルにアクセスできるようにします。

監視とログ記録

AI モデルのパフォーマンス、リソース使用率、潜在的な問題を追跡するための監視およびログ記録システムの設定は必須です。クラウドで AIGC を処理するために構築された異常アラート メカニズムと観測可能性システムを確立します。

さらに、AIGC はリソースを大量に消費する可能性があるため、クラウド リソース コストを継続的に監視して最適化します。クラウド コスト管理ツールとプラクティスを使用します。これは、FinOps がデプロイメントのあらゆる側面を監視し、少なくとも運用コストの効率性とアーキテクチャの効率を改善して、アーキテクチャが最適かどうかを評価する必要があることを意味します。ほとんどのアーキテクチャでは調整と継続的な改善が必要です。

その他の考慮事項

高可用性を確保するにはフェイルオーバーと冗長性が必要であり、災害復旧計画により、必要に応じて冗長性を実装することで、システム障害が発生した場合のダウンタイムとデータ損失を最小限に抑えることができます。さらに、クラウド インフラストラクチャ内の AIGC システムのセキュリティを定期的に監査および評価して、ギャップを解消し、コンプライアンスを維持します。

特に、ユーザーに影響を与えるコンテンツを生成したり、決定を下したりする場合には、AI の倫理的な使用に関するガイドラインを確立することをお勧めします。偏見と公平性の問題に関しては、現在 AI と公平性に関する訴訟が起こっており、正しいことを行っているかどうかを確認する必要があります。 AI によって生成されたコンテンツがユーザーの期待に応え、エンゲージメントを強化できるように、ユーザー エクスペリエンスを継続的に評価します。

AIGC を使用するかどうかにかかわらず、クラウド コンピューティング アーキテクチャの他の側面は同様です。重要なのは、いくつかの事柄の方がはるかに重要であり、より厳密さが求められ、常に改善の余地があることを認識することです。

<<:  ゲーム業界の幹部が語る: クラウド サービスを活用してゲーマーの関心を維持する方法

>>:  ハイブリッドクラウドでエッジコンピューティングを最適化する3つの方法

推薦する

618、李嘉奇の「包囲と鎮圧」

5月31日午後8時、618イベントは最終支払いと現物商品の受け取りとともに正式にスタートしました。こ...

48時間以内に百度のトップ3に入るメカニズムについての個人的な分析

A5にもそのような広告があり、ウェブマスターステーションにもそのような広告があります。他の人が広告を...

方周子は広東テレビの司会者を訴え、裁判所から賠償金を受け取った。一部の侵害は侵害された。

方周子さんは、広東省のテレビ司会者、王牧迪さんが微博で自分を中傷し侮辱したと信じ、名誉権侵害で王牧迪...

理にかなったクラウド回帰 5 つ

今日、ますます多くの企業が、選択したアプリケーションをクラウドからオンプレミスまたはホストされたデー...

クラウド自動化がサイバーセキュリティの未来にとって重要な理由

多くの組織は、特に自律的な許可とアクセス権と組み合わせることで、サイバーセキュリティの将来を計画する...

Apple Cloudが貴州省に移転。クラウドコンピューティング業界の現状はどうでしょうか?

2018年の初め、クラウドコンピューティングをめぐる戦いが再び始まろうとしているようだ。昨年初めの厦...

2012年は医療業界にとって百度の「審判の日」となるのか?

最新の報道によると、百度百科事典はすべての医療項目に専門認証を導入する。一般ユーザーは編集に参加でき...

WeChatの輝きが薄れる中、テンセントは成長停滞の苦境に陥っている

テンセントは微妙な岐路に立っている。テンセントの株価が史上最高値に達した後、資本市場の不安がついに表...

SEOから仕事の効率を理解する

ここ数ヶ月、時間の制約により、記事をほとんど書いていません。もちろん、時間的な要因に加えて、もう1つ...

K8s コンテナ ネットワーク仮想化を 1 つの記事で理解する

[[437199]]この記事を読むには、読者がイーサネットの基本原理と Linux システムの基本的...

意見:企業はマルチクラウドを心配するのではなく、ハイブリッドクラウド戦略にもっと重点を置くべき

実際、多くの企業がマルチクラウドを使用していますが、それが何であり、なぜそうするのかを知っている人は...

ウェブサイトの掲載は実際にランキングを下げるのでしょうか?

ウェブマスターは、自分のウェブサイトにできるだけ多くの項目を含めるという目標を追求しています。それは...

GINERNET-6 EUR/1G RAM/10G SSD/300G フロー/500G D

より大きな DDOS の圧力に耐えられる安価なホストを探している場合は、GINERNET がリリース...

企業がトラフィックを収益化したい場合、Baidu Xiong Zhanghaoはこれが可能であると述べている

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っていますトレンドの...

百度の大爆発 - Kステーションイベントの可能性分析

少し前に、私のウェブサイトも含め、多くのウェブサイトがブロックされました。一瞬、誰もが混乱し、何が原...