T フロントライン: クラウド ネイティブへの変革はどれほど難しいのでしょうか?

T フロントライン: クラウド ネイティブへの変革はどれほど難しいのでしょうか?

花と棘が共存する。外部から見ると、クラウド ネイティブは高級で上品、そしてファッショナブルな流行語として見られます。その文脈には、回復力、観察可能性、強靭性、持続可能性など、多くの美しい言葉が登場します。しかし、実装となると、一夜にして達成できるものではありません。

クラウドネイティブへの変革は、企業の長期的な発展に影響を与える重要な対策です。 Zuoyebang の基本的な技術アーキテクチャは成功裏に変革を遂げましたが、変革中に直面した課題も数多くありました。どのような変革体験から学ぶ価値があるでしょうか?

Zuoyebang のインフラストラクチャ責任者である Dong Xiaocong 氏を招き、マルチクラウドへの取り組みに関する Zuoyebang の考えや考察を共有してもらいました。この記事が、デジタル変革をしようとしている、またはデジタル変革の過程にある開発者やマネージャーの役​​に立つことを願っています。

Q: Zuoyebang がクラウド ネイティブを選択した理由は何ですか?

A: 私は2019年にZuoyebangに入社しましたが、当時の基本的な技術アーキテクチャには2つの特徴があることがわかりました。

1. 規模: Zuoyebang にはオンラインで数千のアプリケーション サービスがあり、多数のアプリケーション サービスは数万のサービス インスタンスに対応し、多数のサービス インスタンスは数十万のコンピューティング コアで実行されます。 2. 複雑さ: Zuoyebang の全体的なテクノロジー スタックは比較的多様です。最も大きなシェアを持つテクノロジースタックは Golang と PHP であり、多数のモジュールが C++、Python、Java などで書かれています。

さらに、ビジネス特性やチーム特性も大きく異なります。たとえば、トラフィック製品の場合、テクノロジー スタックは保守的になる傾向がありますが、産業用インターネットのビジネス アーキテクチャはドメインによって駆動され、マイクロサービス アーキテクチャはより徹底的です。

Zuoyebang は安定性、効率性、コストの面でも多くの課題に直面しています。

安定性の面で。従来のインターネット企業では、ユーザーと直接接触することはほとんどなく、ユーザーに対する認識は UV 数や PV 数で決まる傾向がありました。しかし、オンライン教育は違います。ライブ中継などを通じて生徒一人ひとりと向き合います。あらゆる安定性事故は彼らの学業に影響を与え、取り返しのつかない損失を引き起こす可能性があります。したがって、Zuoyebang の安定性に対する要件はますます高くなります。まず、アーキテクチャが単一マシン、単一マシン クラスター、または単一クラウドの障害の影響にうまく対処できるかどうかを検討します。コードの変更によって業務が中断した場合、損失を迅速に止めることができますか?

もう一つの例は効率の問題です。オフラインとオンラインの成果物が異なるため (たとえば、コンテナーはオフラインで使用されますが、仮想マシンはオンラインで使用されます)、両側の環境も異種であり、R&D、運用、保守、テストのサイクルとコストが飛躍的に増加します。

ネットワークのジッタやサービス障害が発生すると、関係者全員が継続的に調整する必要があり、研究開発部門は運用保守を待ち、運用保守部門はクラウドベンダーの回復を待つことになり、ユーザーにとって非常に悪い体験となります。

もう 1 つの大きな部分は、ビジネス上の考慮に基づいて複数のメーカーと交渉した結果である IT 支出の考慮によるものです。

要約すると、安定性、コスト、効率性などの問題を考慮して、Zuoyebang はクラウド ネイティブとマルチクラウドを選択しました。

変革後の全体的なメリットは非常に明白です。まず、安定性の面では、全体的なマシン障害の影響が数分から数秒に短縮され、配信と展開の品質が大幅に向上しました。コスト面でも明らかなメリットがあります。

Q: Zuoyebang はクラウドネイティブ化の過程で多くの特許を取得してきました。簡単に紹介していただけますか?

A: 近年、Zuoyebang はクラウド ネイティブ分野でいくつかの成果を積み重ねており、業界との共有やコミュニケーションを非常に喜んでいます。ここにそのいくつかを挙げます。

例えば、リソースレベルでは、Zuoyebang はさまざまなクラウドのネットワークを接続し、接続性、高信頼性、センサー制御機能の観点からコンピューティングライフサイクルプラットフォームを処理および開発しました。コンテナレベルでは、マルチクラウド配信プラットフォームを開発しました。サービスガバナンスレベルでは、分散ログクエリエンジンソリューションを開発しました。このソリューションのコストは ES の 1/10 に過ぎず、全体的なクエリ効率も比較的高くなります。 1TB のログを照会するのに 5 秒もかからないため、研究開発の効率が大幅に向上します。トラフィック制御の点では、Zuoyebang のソリューションは P90 損失を 0.8 ミリ秒に削減しましたが、オープンソース ソリューションは通常 3 ミリ秒です。アプリケーションレベルでは、Zuoyebang は自由に切り替え可能なマルチクラウド システムも構築しています。その中でも、より古典的なのは、発信コール システムをマルチアクティブ アーキテクチャに構築することです。

Q: クラウドネイティブの発展についてどのようにお考えですか?

A: クラウド ネイティブは、コンテナ化、サービス メッシュ、マルチアクティブという 3 つの主要機能を提供します。これら 3 つの機能の最終的な目標は、これまでクラウドで制限されていた機能を解放することです。詳しく説明すると、まずコンテナは基本機能です。コンテナが 100% 実現された場合にのみ、上位層の機能を解放できます。

2番目はサービスメッシュです。現在、業界では既にIstioという主流のソリューションがあり、BATが独自に開発したソリューションもあり、中堅・ロングテール企業に受け入れられていますが、メカニズムやパフォーマンスに問題もあります。 Meshに関しては、業界はまだ統一された標準に達していません。コンテナ K8S 標準の形成に伴い、Mesh の標準でも業界関係者間の衝突、コミュニケーション、探索が必要になります。

私は個人的に、Microsoft が提案した Dapr のマルチランタイムのアイデアに対してより楽観的です。より多くのランタイムを Sidecar にオフロードし、本質的にミドルウェアとビジネス コードをさらに分離します。

3つ目は、上位レベルでのマルチクラウドとマルチアクティブです。 Alibaba Cloud Native Practice Summit で、アプリケーション マルチアクティブに関するホワイト ペーパーが公開されました。企業のクラウドネイティブに対するパフォーマンス要件はますます高まっており、クラウドネイティブの仕様や標準はより明確かつ具体的になってきていることがわかります。

Q: GPU コンテナ化とマルチクラウド移行について教えてください。

A: GPU スケジューリングの最適化は、Homework Helper が多くのリソースを占有する AI 推論と画像認識を使用するという事実に端を発しています。 GPU は比較的高価なリソースです。いくつかのソリューションを調査し、クラウド ベンダーとコミュニケーションをとることで、推奨される主なソリューションは GPU コンテナ化であることがわかりましたが、これにより少なくとも 15% のパフォーマンス損失が発生し、これは許容できません。しかし、ほとんどの GPU サービスで使用されるさまざまなリソースは比較的固定されていることがわかりました。そのため、Zuoyebang はコンピューティング能力とビデオ メモリに基づいて戦略的なスケジューリングを実行し、これらのサービスをリソースと一致させました。これは古典的なナップサック問題です。同時に、夜間の予測やスケジュール変更も行います。途中で何らかの障害が発生した場合は、転送関連の戦略も実行されます。 GPU サービスは 100% コンテナ化されました。

当時、Zuoyebang にとってマルチクラウドへの移行は困難でした。同時にコンテナ化の変革にも取り組んでいるため、重複した実装は非常に困難です。私たちのアプローチは、サービス登録を統合し、基本的にコンテナと仮想マシン間のギャップを埋めることです。複数のクラウド間の移行は段階的に行われます。移行する必要があるビジネスは、サービス検出プロセス中に分離され、バッチで実行できます。

Q: Zuoyebang のクラウド ネイティブ変革は、テクノロジー管理にどのような変化をもたらしますか?

A: 最も明白なことは、運用と保守の方法に一定の影響が出るということです。中規模企業では運用・保守職の採用は難しい。手作業が減ることで、反復的な機械的なタスクに限定されなくなり、インフラストラクチャの機能に重点が置かれるようになります。

テクノロジーの変化は馬車から電車への変化に似ています。タイムリーに新しいテクノロジーに移行できれば、新たな成長がもたらされると信じています。

テクノロジー マネージャーの皆様には、この大きな変化に積極的に参加していただくようお願いいたします。クラウド ネイティブ自体はオープン性を表すものであり、オープン ソースとメーカー間の競争を表すものではありません。皆様が参加して協力し合い、この分野をさらに完璧なものにしていただければ幸いです。今日クラウド ネイティブを一歩前進させれば、明日のクラウド ネイティブのアップグレードから大きな成果が得られるでしょう。

同時に、企業がクラウドネイティブ変革を進める際には、主流の技術ソリューションを盲目的に追求するのではなく、実際のビジネス状況に基づいて選択を行い、実用的なメリットを得る必要があります。チーム管理の面では、クラウド ネイティブ変革プロセス中に、チームが変化を受け入れるという前向きな姿勢を維持するように積極的に指導する必要があります。さらに、設備の不備など、我慢するにはある程度の時間を要する客観的な問題も次々と生じます。

Q: オープンソースに関して、Zuoyebang はどのような進歩を遂げましたか?

A: Zuoyebang は常にオープンソース コミュニティに貢献してきました。たとえば、以前はオープンソースのログ記録ソリューションを使用していました。次のステップとして、プロジェクト全体のオープンソース化については、一般に公開する前にプロジェクトをさらに完璧で普遍的なものにしたいと考えています。オープンソース化後は、業界の友人たちとコミュニケーションをとることを楽しみにしています。

最後に

コンテナ化、サービスメッシュ、マルチアクティブアーキテクチャは、これまでのクラウドネイティブ開発の3つの最も重要な特徴と言えます。これらの機能は、無数のクラウド開発者の共同の努力の結果です。

ドンさんがおっしゃったように、クラウドネイティブは広大な海です。より多くの開発者と企業が一緒に参加してこそ、クラウド ネイティブが実を結び、私たちに密接に関係するデジタル世界を変えることができるのです。

専門家の紹介

董暁聰氏は2019年に左葉邦に入社し、左葉邦のインフラ部門の責任者を務めている。アーキテクチャ開発、運用保守、DBA、セキュリティ関連業務を担当しています。彼は Alibaba Cloud MVP および Tencent Cloud TVP です。 Baidu、Didiなどの企業でアーキテクチャと技術管理を担当し、ビジネスミドルプラットフォーム、テクニカルミドルプラットフォーム、R&Dミドルプラットフォームの構築と反復を得意としています。

Zuoyebangは2015年に設立されました。テクノロジーを活用してインクルーシブ教育をサポートする企業です。同社の主な事業は2つの主要部門に分かれている。まず、Zuoyebangアプリは典型的な交通インターネット製品です。第二に、Zuoyebangライブ授業は典型的な産業インターネット製品であり、教育研究、教授、学務、個別指導などの教育アンカーチェーンをカバーしています。

<<:  Microsoft Azure が中国に新たなデータセンター リージョンを正式に開設

>>:  企業がクラウド支出を管理するためのクラウドコスト最適化戦略

推薦する

Taoxie.com がウェブサイト アーキテクチャの観点から SEO をレイアウトする方法 (パート 2)

「ウェブサイトアーキテクチャの観点から見たTaoxie.comのSEOレイアウト(1)」という記事を...

JVM エスケープ解析

[[334435]]エスケープ分析とは何かコンパイラの最適化理論では、エスケープ解析はポインタの動的...

weloveservers ロサンゼルスのハイエンド VPS 最終レビュー

これはおそらく、weloveservers.net が HostCat Blog に登場する最後の機...

ユーザーがどのようにウェブサイトを閲覧しているかご存知ですか?

実は、多くの人が、ユーザーが自分のウェブサイトを閲覧するときにどのような心理や習慣を持っているかを知...

テンセントカンファレンスのユーザー数が1億人を突破、最大2,000人の同時参加をサポートするエンタープライズ版をリリース

発売から245日後、Tencent Meetingのユーザー数は1億人を突破し、最も早く1億ユーザー...

全国の中小企業の業務再開に無料のクラウドリソースを提供するUCloudの防疫支援プランがアップグレードされました

現在、感染症の予防・抑制の状況は依然として厳しく、さまざまな業界や分野の中小企業に多大な影響を及ぼし...

新しい CN ドメイン名ポリシーがドメイン名登録者に与える影響

今月28日、CNNICは新しいドメイン名政策である「中国インターネットネットワーク情報センタードメイ...

小紅書はどうやって十一月を乗り切るのでしょうか?

毎年恒例のダブルイレブンプロモーションが終了に近づいています。 「数秒で数千億を突破」というデジタル...

リンクを含むブログ記事を取得するためのいくつかの重要なポイント

グループ内で「私のブログは一度も掲載されません。リンクがなくてもすぐに掲載されるのに、リンクが張られ...

簡単な議論: タレントウェブサイトの革新的な収益モデル

タレントサイトといえば、現在多くの個人ウェブマスターが管理が難しいと語っています。タレントサイトを収...

100TB 香港クラウド VPS - 376M メモリ/10G ハードディスク/1T トラフィック/xen/onapp

UK2 グループの 100TB もクラウド VPS の提供を開始しました。もちろん、vps.net ...

企業はクラウドコンピューティングの使用に関して災害復旧計画をどのように策定すべきでしょうか?

災害復旧とは、COVID-19 によって引き起こされたビジネスの歪みを含む自然災害やサイバー攻撃の後...

クラウド移行の隠れたコスト

今では、IT プロフェッショナルは、企業のビジネス開発に対するクラウド移行のメリットを明確に認識して...

集団的な躍進の後、中国のパブリッククラウドの次のステップは何でしょうか?

International Data Corporation (IDC) が最近発表したレポートによ...

高品質のバックリンクは減少するのではなく、増加するだけである

今朝QQにログインしたら、グループで誰かがBaiduを罵倒しているのを見ました。今日はBaiduが自...