大規模なベアメタル管理は難しい? UMCloudのZhang WenmoがOpenStackを使って問題を解決する方法を教えます

大規模なベアメタル管理は難しい? UMCloudのZhang WenmoがOpenStackを使って問題を解決する方法を教えます

[51CTO.comより引用] 2018年5月18日〜19日、51CTO主催のグローバルソフトウェアおよび運用技術サミットが北京で開催されました。このサミットでは、人工知能、ビッグデータ、モノのインターネット、ブロックチェーンなど12の核心的なホットトピックに焦点を当て、国内外から60人の第一線の専門家が集まります。これはハイエンドのテクノロジーの饗宴であり、トップクラスの IT 技術者が学び、ネットワークを拡大するための見逃せないプラットフォームです。

19日午前の「OpenStackイノベーションと実践」フォーラムでは、UMCloudアーキテクチャディレクターの張文墨氏が「OpenStackの大規模ベアメタル管理のベストプラクティス」と題した素晴らしい講演を行い、UMCloudが数多くのベアメタルプロジェクトの実践からまとめた方法論とソリューションを参加者と共有しました。

[[233088]]

UMCloud アーキテクチャ ディレクター、張文模

OpenStackを使用した統合ベアメタル管理

張文墨氏によると、UMCloudは上海、南京、成都、仏山、北京に5つのデータセンターを設立しており、合計4,000台以上のベアメタルマシンを保有している。 5 つのデータセンターすべてに OpenStack クラスターが存在し、同時に 5 つのクラスターに 800 ~ 2,000 個の異なるノードを追加する必要があります。これらのノードは OpenStack によって均一に管理される必要があります。

複数のテクノロジーを選択した後、UMCloud は最終的にクラスター管理を実装するために Ironic の OpenStack O バージョンを選択しました。 Ironic を選ぶ理由この点について、張文墨氏は、Ironic には、ベアメタル構成情報の自動取得、ベアメタルシステムへの自動インストール/消去機能の提供、OpenStack 仮想マシンの管理のようにベアメタルを管理する機能という 3 つの非常に実用的な機能があると説明しました。 Ironic の利点は、単一のクラスターで 3,000 台を超えるベアメタル マシンをサポートでき、他の OpenStack コンポーネントとリンクすることもできることです。

もちろん、張文墨氏も、小規模なクラスターであれば、Ironic の機能、性能、管理方法はすでにほとんどのニーズを満たしているが、数百台、あるいは数千台を超えるマシンの大規模なベアメタル管理となると、まだいくつかの欠点があることは認めている。

彼は例を挙げて、Ironic にはツリー構造がなく、ベアメタル情報の入力や処理も比較的複雑だと述べました。 2 番目に深刻な問題は、ベアメタル ネットワークを管理できないことです。最も直接的な理由は、実は Ironic にはスイッチを管理および構成する方法がないからです。 3 つ目の欠点は、すべてのベアメタル マシンが大きなプールに配置されるため、大規模な管理上の欠陥が発生することです。たとえば、顧客は 2,000 台のベアメタル マシンを所有しており、トランスコーディング ビジネス ドメインで複数のラックを使用し、外部ラックもいくつか使用したいと考えていますが、現在 Ironic にはこの区別がありません。すべてのベアメタル マシンは大きなプールに含まれており、つまり、すべてのビジネスが混在しています。したがって、大規模なベアメタルマシンを管理するために Ironic を使用するだけでは、まだ不十分です。

Ironic で大規模にベアメタルを管理する際の 5 つの重要なポイント

「そのため、大規模なIronicベアメタル管理を実施する際には、主に5つの点に重点を置きました。」張文墨氏は、大規模ベアメタル情報の自動入力、大規模ベアメタルハードウェア情報の自動収集、大規模ベアメタル情報の自動処理、上位層スイッチネットワークの自動構成、ベアメタルのプーリングであると明らかにした。

これら 5 つの重要なポイントを正式に解釈する前に、Zhang Wenmo はまず次のネットワーク アーキテクチャ図を全員に示しました。

Zhang Wenmo 氏は、このアーキテクチャの唯一の目的はベアメタル サーバー (下の図のベアメタル サーバー (オレンジ色の領域)) にサービスを提供することだ、と説明しました。ベアメタル サーバーの左側にある赤い線は、Ironic Conductor (緑の領域) に重点を置いた基本的な IPM 管理ネットワーク セグメントです。このコンポーネントは主に、起動、シャットダウン、再起動、ハードディスクの起動、その他の構成を含むベアメタル サーバーの電源サイクル管理を完了するために使用されます。ベアメタル サーバーの右側にあるオレンジ色の線は、帯域外 1G Inspect (ベアメタル情報の自動収集) です。ベアメタル サーバーの下にあるバンドルされたラインは、ネットワーク管理スイッチに接続され、次に Zabbix Server ネットワーク管理サーバーに接続されます。実際、このラインはベアメタル デバイスの自動監視として存在します。ベアメタル サーバー上のバンドル ラインには、左側にビジネス ネットワーク セグメント、右側にストレージ ネットワーク セグメントがあります。この図はオリジナルのコンセプトマップであり、UMCloud が後から若干の調整を加えました。

先ほど述べた5つの重要なポイントに戻り、張文墨氏はそれらを一つずつ分析し、解釈しました。

大規模ベアメタル情報の自動入力: ベアメタル情報入力の技術的内容は高くありませんが、時間がかかり、プロジェクト実装における最大の課題です。これには、ハードウェア統合が標準配線、標準構成、標準集計の 3 つの標準を満たす必要があり、特定のルールに従ってスクリプトを通じてデータを自動的に入力する必要があります。

大規模ベアメタルハードウェア情報の自動収集: Ironic Inspector/Conductor を使用してベアメタル情報を自動収集します。まず、Conductor を使用して、IPMI 経由でベアメタルを起動します。次に、ベアメタルは PXE を介して Inspector からメモリ オペレーティング システムを取得します。最後に、オペレーティング システムは組み込みの IPA を通じてベア メタル情報を Inspector に報告します。

大規模な自動ベアメタル情報処理: ベアメタル情報処理プロセスの最初のステップは、接続されていないネットワーク インターフェイスを削除することです。 2 番目のステップは、オペレーティング システムをインストールするためのネットワーク インターフェイスを指定することです。 3 番目のステップは、指定されたビジネス ポートをバインドすることです。上記のタスクを完了するための鍵は、local_link_information にあります。

上位層スイッチ ネットワークの自動構成: 最初の 3 つのポイントは主に効率の最適化であり、ベアメタルの管理時間を大幅に短縮できますが、スイッチ ネットワークを管理することはできません。そこで、UMCloudはまずSDNスイッチを導入し、Huaweiとの協力関係に至りました。両者はベアメタル管理を適応・開発し、下図のようなプロセスを考案しました。これにより、OpenStack は SDN を通じてスイッチを自動制御し、自動管理を実現できるようになりました。

ベアメタル プーリング: これは、ビジネス要件、物理的な場所、その他の基準に基づいて、同じ大きなベアメタル プールを複数の小さなプールに分割することを意味します。これは、まずベアメタル フレーバーの機能パラメータを使用し、次に対応するベアメタル フレーバーのメタデータでそれを一致させることによって行われます。

UMCloud の技術的実践により、現在のベアメタル配信速度は 1 日あたり 300 ベアメタル (10 時間で計算) に達し、サービス切り替え/ビジネス拡張の速度は 20 分ごとに 30 ベアメタルに達することがわかりました。さらに、UMCloud の 20 個のベアメタル リソース プールでは、プール内のベアメタルの自動割り当てとプール間の分離を実現できます。

上記内容は、WOT2018 グローバルソフトウェアおよび運用技術サミットにおける UMCloud アーキテクチャディレクターの張文墨氏の講演を基に 51CTO 記者がまとめたものです。 WOT の詳細については、.com をご覧ください。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<:  【WOT2018】Shi Yang: エッジコンピューティングリファレンスアーキテクチャ2.0の実践と考察

>>:  サーバー仮想化のトレンドとメリットのまとめ、あなたはどれが気になりますか?

推薦する

spinservers: 安価なハイエンドの米国サーバー、月額 99 ドル、2*E5-2630L v3/256g メモリ/3.2T SSD/30T トラフィック/10Gbps 帯域幅

spinservers は、新しく非常に安価な米国サーバーを導入しました。今回の独立サーバーは、25...

多くの APP 起業家はこのステップのやり方を知りません。LOGO Design Network がそのやり方を教えます!

月給5,000~50,000のこれらのプロジェクトはあなたの将来ですスマートフォンの普及に伴い、モバ...

Google App EngineはPHP環境をサポート

Google の公式ブログによると、Google App Engine は 4 番目の言語である P...

タオバオモバイルは12の印刷メディアと提携し、メディア電子商取引の分野をテストするためにタオバオを立ち上げた。

新浪科技は4月1日午前、アリババが本日、タオバオモバイルと全国12の主流新聞社との戦略的提携「馬商淘...

3大通信事業者の4Gアプリケーションの比較

3Gはまだ普及しておらず、4Gが本格的に普及しつつある。TD-LTEライセンスが発行されてから半年以...

簡単な議論: タレントウェブサイトの革新的な収益モデル

タレントサイトといえば、現在多くの個人ウェブマスターが管理が難しいと語っています。タレントサイトを収...

「クラウドコンピューティング」は「エッジコンピューティング」に置き換えられるのでしょうか?

最近、「クラウドコラボレーション」という言葉をよく耳にしますが、これはクラウドとエンドが協力し、浸透...

prometeus-$6.37/イタリア VDS/KVM/4g メモリ/40g SSD/1T トラフィック

Prometeus は、「Logical PARtition KVM Servers」という新しい ...

2023 年の成長を牽引する 5 つの主要なデジタル トレンド

今日、あらゆる業界の企業は、厳しい労働環境と予測不可能な経済情勢の中で繁栄するために、大きな課題に直...

簡単な分析: 有料ランキングを理解するための4つの基本的な提案

しかし、現在、ほとんどの企業やウェブサイト構築の専門家は、「入札」は高すぎるし、まさに底なし沼だと不...

ウェブサイトが降格された後の外部リンクの対処戦略

ウェブサイトの順位が下がる理由は、制御できない要因を除けば、キーワードの蓄積、コンテンツの収集、外部...

ローカルウェディングネットワーク:ウェディングネットワークの新時代を切り開く

近年のブラインドデート番組の人気により、「ブラインドデートウェブサイト熱」の波も起こっています。 B...

ウェブサイトの閉鎖を命じる文書:フォーラムサービスプロバイダー5d6dがサービスの停止を発表

@卢松松ニュース:注意深い友人は、康盛傘下の中国最大の無料フォーラムサービスプロバイダーである5d6...

SEOの実行について:重労働だと思わない

インターネット上には古典的な SEO ジョークが数多く出回っており、「実行」という言葉が頻繁に登場す...

SEO 担当者育成のための完全ガイド

SEO は精神的にも肉体的にも労力を要する二重労働ですが、ほとんどの初心者が受け入れることができない...