T フロントライン: クラウド ネイティブへの変革はどれほど難しいのでしょうか?

T フロントライン: クラウド ネイティブへの変革はどれほど難しいのでしょうか?

花と棘が共存する。外部から見ると、クラウド ネイティブは高級で上品、そしてファッショナブルな流行語として見られます。その文脈には、回復力、観察可能性、強靭性、持続可能性など、多くの美しい言葉が登場します。しかし、実装となると、一夜にして達成できるものではありません。

クラウドネイティブへの変革は、企業の長期的な発展に影響を与える重要な対策です。 Zuoyebang の基本的な技術アーキテクチャは成功裏に変革を遂げましたが、変革中に直面した課題も数多くありました。どのような変革体験から学ぶ価値があるでしょうか?

Zuoyebang のインフラストラクチャ責任者である Dong Xiaocong 氏を招き、マルチクラウドへの取り組みに関する Zuoyebang の考えや考察を共有してもらいました。この記事が、デジタル変革をしようとしている、またはデジタル変革の過程にある開発者やマネージャーの役​​に立つことを願っています。

Q: Zuoyebang がクラウド ネイティブを選択した理由は何ですか?

A: 私は2019年にZuoyebangに入社しましたが、当時の基本的な技術アーキテクチャには2つの特徴があることがわかりました。

1. 規模: Zuoyebang にはオンラインで数千のアプリケーション サービスがあり、多数のアプリケーション サービスは数万のサービス インスタンスに対応し、多数のサービス インスタンスは数十万のコンピューティング コアで実行されます。 2. 複雑さ: Zuoyebang の全体的なテクノロジー スタックは比較的多様です。最も大きなシェアを持つテクノロジースタックは Golang と PHP であり、多数のモジュールが C++、Python、Java などで書かれています。

さらに、ビジネス特性やチーム特性も大きく異なります。たとえば、トラフィック製品の場合、テクノロジー スタックは保守的になる傾向がありますが、産業用インターネットのビジネス アーキテクチャはドメインによって駆動され、マイクロサービス アーキテクチャはより徹底的です。

Zuoyebang は安定性、効率性、コストの面でも多くの課題に直面しています。

安定性の面で。従来のインターネット企業では、ユーザーと直接接触することはほとんどなく、ユーザーに対する認識は UV 数や PV 数で決まる傾向がありました。しかし、オンライン教育は違います。ライブ中継などを通じて生徒一人ひとりと向き合います。あらゆる安定性事故は彼らの学業に影響を与え、取り返しのつかない損失を引き起こす可能性があります。したがって、Zuoyebang の安定性に対する要件はますます高くなります。まず、アーキテクチャが単一マシン、単一マシン クラスター、または単一クラウドの障害の影響にうまく対処できるかどうかを検討します。コードの変更によって業務が中断した場合、損失を迅速に止めることができますか?

もう一つの例は効率の問題です。オフラインとオンラインの成果物が異なるため (たとえば、コンテナーはオフラインで使用されますが、仮想マシンはオンラインで使用されます)、両側の環境も異種であり、R&D、運用、保守、テストのサイクルとコストが飛躍的に増加します。

ネットワークのジッタやサービス障害が発生すると、関係者全員が継続的に調整する必要があり、研究開発部門は運用保守を待ち、運用保守部門はクラウドベンダーの回復を待つことになり、ユーザーにとって非常に悪い体験となります。

もう 1 つの大きな部分は、ビジネス上の考慮に基づいて複数のメーカーと交渉した結果である IT 支出の考慮によるものです。

要約すると、安定性、コスト、効率性などの問題を考慮して、Zuoyebang はクラウド ネイティブとマルチクラウドを選択しました。

変革後の全体的なメリットは非常に明白です。まず、安定性の面では、全体的なマシン障害の影響が数分から数秒に短縮され、配信と展開の品質が大幅に向上しました。コスト面でも明らかなメリットがあります。

Q: Zuoyebang はクラウドネイティブ化の過程で多くの特許を取得してきました。簡単に紹介していただけますか?

A: 近年、Zuoyebang はクラウド ネイティブ分野でいくつかの成果を積み重ねており、業界との共有やコミュニケーションを非常に喜んでいます。ここにそのいくつかを挙げます。

例えば、リソースレベルでは、Zuoyebang はさまざまなクラウドのネットワークを接続し、接続性、高信頼性、センサー制御機能の観点からコンピューティングライフサイクルプラットフォームを処理および開発しました。コンテナレベルでは、マルチクラウド配信プラットフォームを開発しました。サービスガバナンスレベルでは、分散ログクエリエンジンソリューションを開発しました。このソリューションのコストは ES の 1/10 に過ぎず、全体的なクエリ効率も比較的高くなります。 1TB のログを照会するのに 5 秒もかからないため、研究開発の効率が大幅に向上します。トラフィック制御の点では、Zuoyebang のソリューションは P90 損失を 0.8 ミリ秒に削減しましたが、オープンソース ソリューションは通常 3 ミリ秒です。アプリケーションレベルでは、Zuoyebang は自由に切り替え可能なマルチクラウド システムも構築しています。その中でも、より古典的なのは、発信コール システムをマルチアクティブ アーキテクチャに構築することです。

Q: クラウドネイティブの発展についてどのようにお考えですか?

A: クラウド ネイティブは、コンテナ化、サービス メッシュ、マルチアクティブという 3 つの主要機能を提供します。これら 3 つの機能の最終的な目標は、これまでクラウドで制限されていた機能を解放することです。詳しく説明すると、まずコンテナは基本機能です。コンテナが 100% 実現された場合にのみ、上位層の機能を解放できます。

2番目はサービスメッシュです。現在、業界では既にIstioという主流のソリューションがあり、BATが独自に開発したソリューションもあり、中堅・ロングテール企業に受け入れられていますが、メカニズムやパフォーマンスに問題もあります。 Meshに関しては、業界はまだ統一された標準に達していません。コンテナ K8S 標準の形成に伴い、Mesh の標準でも業界関係者間の衝突、コミュニケーション、探索が必要になります。

私は個人的に、Microsoft が提案した Dapr のマルチランタイムのアイデアに対してより楽観的です。より多くのランタイムを Sidecar にオフロードし、本質的にミドルウェアとビジネス コードをさらに分離します。

3つ目は、上位レベルでのマルチクラウドとマルチアクティブです。 Alibaba Cloud Native Practice Summit で、アプリケーション マルチアクティブに関するホワイト ペーパーが公開されました。企業のクラウドネイティブに対するパフォーマンス要件はますます高まっており、クラウドネイティブの仕様や標準はより明確かつ具体的になってきていることがわかります。

Q: GPU コンテナ化とマルチクラウド移行について教えてください。

A: GPU スケジューリングの最適化は、Homework Helper が多くのリソースを占有する AI 推論と画像認識を使用するという事実に端を発しています。 GPU は比較的高価なリソースです。いくつかのソリューションを調査し、クラウド ベンダーとコミュニケーションをとることで、推奨される主なソリューションは GPU コンテナ化であることがわかりましたが、これにより少なくとも 15% のパフォーマンス損失が発生し、これは許容できません。しかし、ほとんどの GPU サービスで使用されるさまざまなリソースは比較的固定されていることがわかりました。そのため、Zuoyebang はコンピューティング能力とビデオ メモリに基づいて戦略的なスケジューリングを実行し、これらのサービスをリソースと一致させました。これは古典的なナップサック問題です。同時に、夜間の予測やスケジュール変更も行います。途中で何らかの障害が発生した場合は、転送関連の戦略も実行されます。 GPU サービスは 100% コンテナ化されました。

当時、Zuoyebang にとってマルチクラウドへの移行は困難でした。同時にコンテナ化の変革にも取り組んでいるため、重複した実装は非常に困難です。私たちのアプローチは、サービス登録を統合し、基本的にコンテナと仮想マシン間のギャップを埋めることです。複数のクラウド間の移行は段階的に行われます。移行する必要があるビジネスは、サービス検出プロセス中に分離され、バッチで実行できます。

Q: Zuoyebang のクラウド ネイティブ変革は、テクノロジー管理にどのような変化をもたらしますか?

A: 最も明白なことは、運用と保守の方法に一定の影響が出るということです。中規模企業では運用・保守職の採用は難しい。手作業が減ることで、反復的な機械的なタスクに限定されなくなり、インフラストラクチャの機能に重点が置かれるようになります。

テクノロジーの変化は馬車から電車への変化に似ています。タイムリーに新しいテクノロジーに移行できれば、新たな成長がもたらされると信じています。

テクノロジー マネージャーの皆様には、この大きな変化に積極的に参加していただくようお願いいたします。クラウド ネイティブ自体はオープン性を表すものであり、オープン ソースとメーカー間の競争を表すものではありません。皆様が参加して協力し合い、この分野をさらに完璧なものにしていただければ幸いです。今日クラウド ネイティブを一歩前進させれば、明日のクラウド ネイティブのアップグレードから大きな成果が得られるでしょう。

同時に、企業がクラウドネイティブ変革を進める際には、主流の技術ソリューションを盲目的に追求するのではなく、実際のビジネス状況に基づいて選択を行い、実用的なメリットを得る必要があります。チーム管理の面では、クラウド ネイティブ変革プロセス中に、チームが変化を受け入れるという前向きな姿勢を維持するように積極的に指導する必要があります。さらに、設備の不備など、我慢するにはある程度の時間を要する客観的な問題も次々と生じます。

Q: オープンソースに関して、Zuoyebang はどのような進歩を遂げましたか?

A: Zuoyebang は常にオープンソース コミュニティに貢献してきました。たとえば、以前はオープンソースのログ記録ソリューションを使用していました。次のステップとして、プロジェクト全体のオープンソース化については、一般に公開する前にプロジェクトをさらに完璧で普遍的なものにしたいと考えています。オープンソース化後は、業界の友人たちとコミュニケーションをとることを楽しみにしています。

最後に

コンテナ化、サービスメッシュ、マルチアクティブアーキテクチャは、これまでのクラウドネイティブ開発の3つの最も重要な特徴と言えます。これらの機能は、無数のクラウド開発者の共同の努力の結果です。

ドンさんがおっしゃったように、クラウドネイティブは広大な海です。より多くの開発者と企業が一緒に参加してこそ、クラウド ネイティブが実を結び、私たちに密接に関係するデジタル世界を変えることができるのです。

専門家の紹介

董暁聰氏は2019年に左葉邦に入社し、左葉邦のインフラ部門の責任者を務めている。アーキテクチャ開発、運用保守、DBA、セキュリティ関連業務を担当しています。彼は Alibaba Cloud MVP および Tencent Cloud TVP です。 Baidu、Didiなどの企業でアーキテクチャと技術管理を担当し、ビジネスミドルプラットフォーム、テクニカルミドルプラットフォーム、R&Dミドルプラットフォームの構築と反復を得意としています。

Zuoyebangは2015年に設立されました。テクノロジーを活用してインクルーシブ教育をサポートする企業です。同社の主な事業は2つの主要部門に分かれている。まず、Zuoyebangアプリは典型的な交通インターネット製品です。第二に、Zuoyebangライブ授業は典型的な産業インターネット製品であり、教育研究、教授、学務、個別指導などの教育アンカーチェーンをカバーしています。

<<:  Microsoft Azure が中国に新たなデータセンター リージョンを正式に開設

>>:  企業がクラウド支出を管理するためのクラウドコスト最適化戦略

推薦する

5Gとエッジコンピューティングが企業の新たな常態への対応にどのように役立つか

コロナウイルス危機への対応として、世界中の組織は、世界が正常に戻るか、少なくとも次の正常に戻るまで待...

Red Hat アジア太平洋パートナーカンファレンス 2018: パートナーエコシステムへの取り組みを強化

オープンソース ソリューションのリーディング プロバイダーである Red Hat, Inc. (NY...

地域不動産ネットワーク開発の考え方:不動産開発業者が活用し、政府が開発を促進

近年、不動産ウェブサイトの人気が高まっています。住宅価格は規制されていますが、住宅を購入する人の数は...

eBay、Catwalkと提携して中国のB2C市場に復帰

首都の冬、電子商取引界の内部統合が加速している。南都日報地図:宋小偉eBayオンラインマーチャントの...

スマートホストのオレゴン-米国(ポートランド)データセンターVPSの簡単なレビュー、TikTok/Netflixのブロック解除

スマートホストはどうですか?スマートホストポートランドVPSはどうですか? Smarthost は、...

Baiduへの警告:不適切な使用はBaiduによる排除につながる

警告: 不適切な使用により Baidu に排除されることがわかっている場合は、外部リンクを構築して外...

返品や交換を減らすには、ユーザーの期待を変えることから始まります

まず、ユーザーが商品を返品または交換したい理由を考えてみましょう。明らかに、悪意のあるレビュー投稿者...

アリババクラウドデータベースは世界の「強力なパフォーマンス」の1つにランクされ、中国企業に好業績をもたらしている

最近、有名な市場調査機関 Forrester が最新のデータベース評価レポート「The Forres...

ウェブマスターは、誰が検索しているのか、誰が検索しているのかを理解する必要がある。

誰が検索しているのか?誰が検索しているのか?ウェブマスターはこの概念を明確に理解していますか?ウェブ...

getdedi-$85/2xL5639/72g メモリ/1T ハードディスク/10T トラフィック/ダラス

getdedi はダラスで特別価格のサーバーをいくつかリリースしています。コストパフォーマンスの良い...

トップレベルドメイン名は価値が上がる可能性が高いため、投機家はドメイン名を偽造して登録する傾向がある。

▲CNNICが裁判所に提出した工業情報化部の回答書(上)と35.comが提出した回答書(下)では、文...

ドメイン名の選択のヒント: ウェブサイトに最適なドメイン名を見つける方法

ウェブサイトを構築するために最初に必要なのはドメイン名です。ドメイン名の選択は、多くのウェブマスター...

ハイブリッドクラウドを有効活用するために5つの障害を解決しましょう

過去数年間、企業はデータ、アプリケーション、開発作業をクラウドに移行する傾向が強まっています。この傾...

tmzVPS-6.8 USD/2g RAM/50g HDD/2T トラフィック/ロサンゼルス/webnx データセンター

tmzvps.com はこれまでずっと比較的価格が高く、主にマネージド VPS を提供しています。現...

ブルーオーシャンからレッドオーシャンへ、ソーシャルコンテンツ電子商取引の未来はどこにあるのでしょうか?

ネットセレブやスターに倣って買い物をすることは、多くの人にとって一般的なショッピングパターンとなって...