大規模なベアメタル管理は難しい? UMCloudのZhang WenmoがOpenStackを使って問題を解決する方法を教えます

大規模なベアメタル管理は難しい? UMCloudのZhang WenmoがOpenStackを使って問題を解決する方法を教えます

[51CTO.comより引用] 2018年5月18日〜19日、51CTO主催のグローバルソフトウェアおよび運用技術サミットが北京で開催されました。このサミットでは、人工知能、ビッグデータ、モノのインターネット、ブロックチェーンなど12の核心的なホットトピックに焦点を当て、国内外から60人の第一線の専門家が集まります。これはハイエンドのテクノロジーの饗宴であり、トップクラスの IT 技術者が学び、ネットワークを拡大するための見逃せないプラットフォームです。

19日午前の「OpenStackイノベーションと実践」フォーラムでは、UMCloudアーキテクチャディレクターの張文墨氏が「OpenStackの大規模ベアメタル管理のベストプラクティス」と題した素晴らしい講演を行い、UMCloudが数多くのベアメタルプロジェクトの実践からまとめた方法論とソリューションを参加者と共有しました。

[[233088]]

UMCloud アーキテクチャ ディレクター、張文模

OpenStackを使用した統合ベアメタル管理

張文墨氏によると、UMCloudは上海、南京、成都、仏山、北京に5つのデータセンターを設立しており、合計4,000台以上のベアメタルマシンを保有している。 5 つのデータセンターすべてに OpenStack クラスターが存在し、同時に 5 つのクラスターに 800 ~ 2,000 個の異なるノードを追加する必要があります。これらのノードは OpenStack によって均一に管理される必要があります。

複数のテクノロジーを選択した後、UMCloud は最終的にクラスター管理を実装するために Ironic の OpenStack O バージョンを選択しました。 Ironic を選ぶ理由この点について、張文墨氏は、Ironic には、ベアメタル構成情報の自動取得、ベアメタルシステムへの自動インストール/消去機能の提供、OpenStack 仮想マシンの管理のようにベアメタルを管理する機能という 3 つの非常に実用的な機能があると説明しました。 Ironic の利点は、単一のクラスターで 3,000 台を超えるベアメタル マシンをサポートでき、他の OpenStack コンポーネントとリンクすることもできることです。

もちろん、張文墨氏も、小規模なクラスターであれば、Ironic の機能、性能、管理方法はすでにほとんどのニーズを満たしているが、数百台、あるいは数千台を超えるマシンの大規模なベアメタル管理となると、まだいくつかの欠点があることは認めている。

彼は例を挙げて、Ironic にはツリー構造がなく、ベアメタル情報の入力や処理も比較的複雑だと述べました。 2 番目に深刻な問題は、ベアメタル ネットワークを管理できないことです。最も直接的な理由は、実は Ironic にはスイッチを管理および構成する方法がないからです。 3 つ目の欠点は、すべてのベアメタル マシンが大きなプールに配置されるため、大規模な管理上の欠陥が発生することです。たとえば、顧客は 2,000 台のベアメタル マシンを所有しており、トランスコーディング ビジネス ドメインで複数のラックを使用し、外部ラックもいくつか使用したいと考えていますが、現在 Ironic にはこの区別がありません。すべてのベアメタル マシンは大きなプールに含まれており、つまり、すべてのビジネスが混在しています。したがって、大規模なベアメタルマシンを管理するために Ironic を使用するだけでは、まだ不十分です。

Ironic で大規模にベアメタルを管理する際の 5 つの重要なポイント

「そのため、大規模なIronicベアメタル管理を実施する際には、主に5つの点に重点を置きました。」張文墨氏は、大規模ベアメタル情報の自動入力、大規模ベアメタルハードウェア情報の自動収集、大規模ベアメタル情報の自動処理、上位層スイッチネットワークの自動構成、ベアメタルのプーリングであると明らかにした。

これら 5 つの重要なポイントを正式に解釈する前に、Zhang Wenmo はまず次のネットワーク アーキテクチャ図を全員に示しました。

Zhang Wenmo 氏は、このアーキテクチャの唯一の目的はベアメタル サーバー (下の図のベアメタル サーバー (オレンジ色の領域)) にサービスを提供することだ、と説明しました。ベアメタル サーバーの左側にある赤い線は、Ironic Conductor (緑の領域) に重点を置いた基本的な IPM 管理ネットワーク セグメントです。このコンポーネントは主に、起動、シャットダウン、再起動、ハードディスクの起動、その他の構成を含むベアメタル サーバーの電源サイクル管理を完了するために使用されます。ベアメタル サーバーの右側にあるオレンジ色の線は、帯域外 1G Inspect (ベアメタル情報の自動収集) です。ベアメタル サーバーの下にあるバンドルされたラインは、ネットワーク管理スイッチに接続され、次に Zabbix Server ネットワーク管理サーバーに接続されます。実際、このラインはベアメタル デバイスの自動監視として存在します。ベアメタル サーバー上のバンドル ラインには、左側にビジネス ネットワーク セグメント、右側にストレージ ネットワーク セグメントがあります。この図はオリジナルのコンセプトマップであり、UMCloud が後から若干の調整を加えました。

先ほど述べた5つの重要なポイントに戻り、張文墨氏はそれらを一つずつ分析し、解釈しました。

大規模ベアメタル情報の自動入力: ベアメタル情報入力の技術的内容は高くありませんが、時間がかかり、プロジェクト実装における最大の課題です。これには、ハードウェア統合が標準配線、標準構成、標準集計の 3 つの標準を満たす必要があり、特定のルールに従ってスクリプトを通じてデータを自動的に入力する必要があります。

大規模ベアメタルハードウェア情報の自動収集: Ironic Inspector/Conductor を使用してベアメタル情報を自動収集します。まず、Conductor を使用して、IPMI 経由でベアメタルを起動します。次に、ベアメタルは PXE を介して Inspector からメモリ オペレーティング システムを取得します。最後に、オペレーティング システムは組み込みの IPA を通じてベア メタル情報を Inspector に報告します。

大規模な自動ベアメタル情報処理: ベアメタル情報処理プロセスの最初のステップは、接続されていないネットワーク インターフェイスを削除することです。 2 番目のステップは、オペレーティング システムをインストールするためのネットワーク インターフェイスを指定することです。 3 番目のステップは、指定されたビジネス ポートをバインドすることです。上記のタスクを完了するための鍵は、local_link_information にあります。

上位層スイッチ ネットワークの自動構成: 最初の 3 つのポイントは主に効率の最適化であり、ベアメタルの管理時間を大幅に短縮できますが、スイッチ ネットワークを管理することはできません。そこで、UMCloudはまずSDNスイッチを導入し、Huaweiとの協力関係に至りました。両者はベアメタル管理を適応・開発し、下図のようなプロセスを考案しました。これにより、OpenStack は SDN を通じてスイッチを自動制御し、自動管理を実現できるようになりました。

ベアメタル プーリング: これは、ビジネス要件、物理的な場所、その他の基準に基づいて、同じ大きなベアメタル プールを複数の小さなプールに分割することを意味します。これは、まずベアメタル フレーバーの機能パラメータを使用し、次に対応するベアメタル フレーバーのメタデータでそれを一致させることによって行われます。

UMCloud の技術的実践により、現在のベアメタル配信速度は 1 日あたり 300 ベアメタル (10 時間で計算) に達し、サービス切り替え/ビジネス拡張の速度は 20 分ごとに 30 ベアメタルに達することがわかりました。さらに、UMCloud の 20 個のベアメタル リソース プールでは、プール内のベアメタルの自動割り当てとプール間の分離を実現できます。

上記内容は、WOT2018 グローバルソフトウェアおよび運用技術サミットにおける UMCloud アーキテクチャディレクターの張文墨氏の講演を基に 51CTO 記者がまとめたものです。 WOT の詳細については、.com をご覧ください。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<:  【WOT2018】Shi Yang: エッジコンピューティングリファレンスアーキテクチャ2.0の実践と考察

>>:  サーバー仮想化のトレンドとメリットのまとめ、あなたはどれが気になりますか?

推薦する

アリババクラウド、世界最高峰のネットワークカンファレンスSIGCOMM2022に6本の論文が選出され過去最高の成績を達成

8月29日、国際的に権威のあるネットワークのトップカンファレンス「SIGCOMM 2022」がオラン...

ワールドカップがやって来ます!大手ブランドがこの祭りでどのようにマーケティングの機会を活用しているかをご覧ください

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています4年に一度...

RamNode: トップアップ残高が 35% 増加、信頼性の高い OpenStack クラウド サーバー プロバイダー、米国とオランダにデータ センター

Ramnode、この堅実なブランドはプロモーションを行っています。新規ユーザーは「クラウド」に登録し...

#11.11# onetechcloud: すべての VPS が 20% オフ (トップアップは 10% オフ)、米国 3 ネットワーク CN2 GIA (ネイティブ IP)\香港 CN2\日本 CN2

onetechcloud は、毎年恒例のダブル イレブン特別プロモーションをお届けします。米国の 3...

Amazon Web Services は、Gartner Magic Quadrant に 12 年連続でランクインしています。クラウド市場をどのようにリードするのでしょうか?

彼はここにいます。そして、「2022 クラウド インフラストラクチャおよびプラットフォーム サービス...

新しいウェブサイトを立ち上げるときは、あまり怖がらないでください。

最適化テクノロジーは、オンライン マーケティング企業によってますます重視されています。多くの新しいサ...

ブログを3ヶ月運営して思ったことをまとめます

ブログは注目度が低下しているウェブサイトの一種であり、ユーザーの定着率が低いという結果が出ていますが...

hostkvm: ロシア CN2 VPS、50% オフ、月額 4.25 ドルから、Windows および Linux システムをサポート

Hostkvm はロシアの VPS を追加しました。これはロシアの CN2 GIA ネットワークに接...

青大根アルゴリズムの深い意味を大胆に推測する

【導入】前回の 2 つの記事では、最近導入されたザクロ アルゴリズムの影響を簡単に分析し、その対処方...

Dell Technologies Cloud Platform: 「新インフラ」時代のクラウドネイティブ変革の「エスコート」

今年の疫病の突発的発生は、間違いなく現在の経済運営システムの能力に対する「大きな試金石」であり、企業...

Baidu Shareは次のBaidu Knowsになるかもしれない

Baidu を注意深く観察すると、最近、Google+1 や Facebook の「いいね!」に似た...

一流の共同購入サイトが再編期に入り、1月の売上は前月比15%減少

共同購入サイトの業績と訪問者数は、正月と春節の期間に減少しました。業界はこの低迷期を打破できるでしょ...

dotsi: ポルトガルのVPS + ポルトガルのサーバー、無制限のトラフィックを提供

dotsi.pt は、2010 年にポルトガルのリスボンで設立されたホスティング プロバイダーです。...

百度のモバイル検索アルゴリズムの調整によりSEO業界はどう変化しているのか

2012 年以降、SEO 業界では「ユーザー エクスペリエンス」の概念に対する理解が深まりました。多...