K8s とビッグモデルは本当に一致するのでしょうか?

K8s とビッグモデルは本当に一致するのでしょうか?

編纂者:ヤン・ジェン

制作 | 51CTO テクノロジースタック (WeChat ID: blog)

K8s とビッグモデルは本当に一致するのでしょうか?この記事は疑問を提起していますが、その答えはまだ検証されていません。

1. K8sは新たなユーザー層を歓迎する

機械学習の研究者が研究論文を読み、PyTorch 環境で Python ベースの GPU を使用してテストしたいとします。彼女はエンジニアリング チームに、2 つの GPU とすべてのライブラリを備えた Jupyter ノートブックへのアクセスを依頼しました。

エンジニアリングチームは彼女に「3日かかります」と言いました。 GPU を調達し、スタックを作成してから、JupyterHub へのアクセスを許可する必要があります。

「これはまさに10年前にDevOpsに起こったことだ」と独立系アナリストのJanakiram氏は3月のKubeCon + CloudNativeCon Europeでの会話の中で語った。

「そこで今、全体的な考え方は、これをどのように加速し、企業の IT 部門がインフラストラクチャを ML 研究者、エンジニア、開発者がすぐに利用できるレベルまで引き上げ、アイデアをすぐにコードに変換できるようにするかということです。」

新しいペルソナは、大規模言語モデル (LLM) がクラウド ネイティブ コミュニティに与える影響を反映し、アイデンティティと Kubernetes の役割に関する疑問を提起します。データ サイエンティストは、モデルを本番環境に導入するために Kubernetes を必要とするのでしょうか?

独立系アナリストの Sanjeev Mohan 氏は、NVIDIA の推論マイクロサービス Nim は Kubernetes 向けに慎重に計画された Docker コンテナであると考えています。

課題は、Kubernetes がデータの状態と頻繁な変更によって、非常にデータ中心になるという事実にあります。 Kubernetes コミュニティにおいて、データがこれほど重要な役割を果たしたことはかつてありません。 Kubernetes コミュニティが、AI の構築、モデルの開発、統合、展開、管理という新たな要求にこのように適応する必要に迫られたことはこれまでありませんでした。

Kubernetes にデータ モデルを展開する標準的な方法がなければ、将来の作業では、コミュニティが新しいハードウェア統合とプロジェクトを通じて新しい「データ ロール」に適応する必要があります。

2. AI によって K8s はどのように強化されるのでしょうか?

Kubernetes サービス LLM、LLM は K8s に対して何ができるでしょうか?

しかし、実際には、AI における Kubernetes の役割は何でしょうか?データの役割に関する質問により、これが最前線に浮上します。 Kubernetes はコントロール プレーンです。確かにその通りです。これは 2014 年から DevOps のアプリケーション アーキテクチャとなっています。

したがって、Mohan が提起した次の質問がより重要になります。K8s は AI に役立っているのか、それとも AI が K8s に役立っているのか?

KubeCon では、Kubernetes を AI のコントロール プレーンとしてどのように使用できるかについて多くのことを学びました。 NVIDIA の基調講演では、GPU の一部を割り当てるための動的リソース割り当てについて説明しました。これによりコストが節約されます。これは AI 向けの Kubernetes です。モハン氏は、これらの開発はすべて順調に進んでおり、Kubernetes が汎用 AI の制御プレーンとしてますます活用されるようになるだろうと述べた。

しかし一方で、LLM はどのようにして K8s をより強力にできるのでしょうか?モハンは非常に想像力豊かな質問をしました。

「まだそういったことはあまり見ていませんが、今後の KubeCon でさらに統合が進むかもしれません」と彼は語った。

OpenAI は明らかに Kubernetes の同盟者であり、同社は実験の開始と拡張に Kubernetes を使用しています。

写真

人気の人工知能研究ラボである OpenAI には、クラウドまたは独自のデータセンターで実験を実行でき、簡単に拡張できるディープラーニング インフラストラクチャが必要です。移植性、速度、コストが主な推進力です。

データ サイエンティストやデータ エンジニアがハードウェア GPU を最も効率的に使用するための構成方法を考えずに、Kubernetes をすべての AI ワークロードのデフォルト オプションにするにはどうすればよいでしょうか。 KubeConでオラクルの上級副社長であるSudha Raghavan氏はこう尋ねた。

Raghavan 氏はまた、KubeCon のパネルで、人々がワークロードごとに物事を行うことが容易になり、エンジニアがすぐに使えるテンプレートを構成し、これらがまだ出現していない AI ワークロード パターンであり、それらに対して事前定義されたテンプレートがあることを理解できるようになるというビジョンについても話しました。

したがって、実験を行いたいデータ サイエンティストは、自分で学習する必要はなく、Cloud Native Computing Foundation がエコシステム内の AI および ML コミュニティに提供するものについて学習することができます。

インテルのオープンエコシステム担当副社長兼ゼネラルマネージャーであるアルン・グプタ氏は、パネルディスカッションの中で、そのギャップを埋めるのはクラウドネイティブコミュニティの責任であると述べた。 「顧客に共感する必要がありますが、顧客はデータ サイエンティストです。新しいクラウド ネイティブ AI の論文では、これらの課題に対処しています」と彼は述べています。

クラウドネイティブAI

グプタ氏と同じパネルで講演したマイクロソフトの主席プロダクトマネージャー、ラクラン・エヴェンソン氏は、Kubernetes コミュニティにおける新しい役割には、データ サイエンティストとインフラストラクチャ エンジニアまたはプラットフォーム エンジニアの間に位置する AI エンジニアも含まれると述べました。

エヴェンソン氏はパネルディスカッションの中で、AIエンジニアはAIの世界のすべての用語を理解する必要があるだけでなく、これらの分散システムを大規模に使用し、これらの新しいプラットフォームを構築する方法も理解する必要があると指摘しました。

3. K8s の約束: スケーラビリティとセキュリティ

Kubernetes の創設者は、Kubernetes をステートレスとして設計し、その後、分散プラットフォームと統合するためのステートフル テクノロジーを構築しました。

「これはこのコミュニティに限定されたものではなく、K8s コミュニティを通じてプラットフォーム上に構築した拡張性にも直接関係しています」とエヴェンソン氏は語った。

「AIがビジネスにどのような影響を与えるか投資し理解したい企業が、データガバナンスやセキュリティを気にすることなくモデルを導入し、ローカル環境で変更や慣れを始めることができるように、オープンソースの代替手段とオープンソースプラットフォームを提供する必要があります。」

参考リンク: https://thenewstack.io/kubernetes-and-ai-are-they-a-fit/

AIGC の詳細については、次の Web サイトをご覧ください。

51CTO AI.x コミュニティ

https://www..com/aigc/

<<:  分散 + ポータブル、クラウド移行後のコスト削減と効率向上の鍵​

>>:  マルチクラウド環境でエンドツーエンドの自動化を実現する方法

推薦する

ウェブサイトのタイトルを変更しますか?

多くのウェブマスターは、このタイトルを見て私を笑うでしょう。これはとても簡単なことではないでしょうか...

#台湾サーバー# serverfield-$169/E5-2407/16g メモリ/250g SSD/無制限トラフィック

serverfield は 2009 年に設立された台湾の会社 (登録番号: 66607099) で...

A5マーケティング:CEO必修コース、知られざる暗黙のルール

上司は、会社の全体的な運営と方向性を調整する高位の役職です。最近では、オフラインでのマーケティングだ...

bigbrainglobal-$65/2* L5420/16g メモリ/10T トラフィック/G ポート/IPMI

bigbrainglobal は、米国バージニア州に拠点を置く新しい IDC 企業です。ドメイン名は...

ドングルと「インターネット+」は離れつつある

SaaSやクラウドコンピューティングが普及する今日、ユーザーやサービス中心のソフトウェアアプリケーシ...

SEO初心者がウェブサイトを最適化する際に犯しがちな5つの間違い

2008 年 9 月 1 日、私は SEO という神聖な業界に正式に参入しました。私の SEO の旅...

Hadoop分散クラスタを構築し、ビッグデータに取り組む方法を教えます

いよいよビッグデータで遊び始めます。以前はhaoopエコシステムについてあまり知りませんでしたが、今...

ソフト記事マーケティングのスキルと計画

ソフトコンテンツマーケティングは、最も一般的で効果的なマーケティング手法です。このマーケティング モ...

時折ホットワードが200のIPを呼び込み、企業ウェブサイトの直帰率に大きな打撃を与えた

人気の単語を検索することでもたらされるトラフィックがかなり大きいことは、誰もが知っていると思います。...

レポート: JavaScript が最も人気のあるプログラミング言語に

業界分析会社 RedMonk は本日、最も人気のあるプログラミング言語の最新の四半期ランキングを発表...

RackNerdのVPSは500日間オンラインです。このVPSを再評価してみましょう

2年前の建国記念日の頃に、ラックナード ロサンゼルス AMD VPS を入手しました。それから約 2...

ウェブマスターはBaiduの重みを改善し、キーワードランキングを向上させるにはどうすればよいか

こんにちは、ウェブマスターの皆さん。今日は、ウェブマスターはどのようにして Baidu の重みを改善...

徹底分析: AWS やその他のクラウド コンピューティング大手は 2018 年にどのような計画を立てるのでしょうか?

最近では、企業規模は企業がクラウド サービス プロバイダーを選択する上で重要な要素ではなくなり、市場...

ウェブサイトは注意深く作成する必要がありますが、洗練され誠実なものでは人々に印象を与えることはできません。

2月12日、陸松松氏は以前自身のブログで宣伝していたブログコメント宣伝手法を公に否定し、「この宣伝手...

ウェブサイトの掲載数の減少は何を意味しますか?

SEO 担当者として、ウェブサイトのインクルージョンをチェックすることは、毎日必ず行うべき宿題です。...