この記事のインタビューの一部は、Kuaimao Nebula の創設者である Lai Wei 氏との以前のインタビューに基づいています。 6月16日〜17日、北京で開催されるWOTグローバルテクノロジーイノベーションカンファレンスで、Lai Wei氏がプロデュースした特別テーマ「観測技術と実践」が発表されます。 Meituan、Kuaimao Nebula、Grey Era などの多くの技術専門家が、Meituan の可観測性プラットフォーム: Raptor の構築と実践、1,000 個のマイクロサービスによる SLO の実装の支援、障害処理のための可観測性システムの構築、クラウドネイティブの時系列データベースの課題とアーキテクチャ設計、およびその他の素晴らしい情報を共有します。 イベントの詳細については、クリックして元のテキストを読むか、下の QR コードをスキャンして、さらにエキサイティングな WOT テーマを確認してください。 WOTカンファレンスの10%割引期間がもうすぐ終了となり、今ならチケットを購入すると割引が多数あります。 1. O&M業界は死んでいないQ: ベテランのO&M専門家の中には、同社がO&Mの価値をほとんど理解していないと指摘する人もいます。 O&M の価値を会社にどのように説明しますか? Lai Wei:会社の経営陣に仕事の価値をシンプルかつ分かりやすく説明し、理解と支援を得る方法は、すべてのミッドエンドおよびバックエンドの技術チームが直面する共通の問題です。そうでなければ、ほんの数分で失業が起きる可能性があります。運用・保守作業の価値を説明するのはさらに困難です。 私の友人の周りでは、運用担当者に退職/転職を勧める投稿をよく見かけます。たとえば、スウェーデンの Ma Gong の投稿「運用担当者を集団で解雇すべき時が来た」は非常に考えさせられるもので、次のような一文で始まります。率直に言って、クラウド ネイティブと DevOps が成熟するにつれて、運用担当者は職種としてもチームとしても歴史的使命を終え、退場するべきです。 例えば、私をこの業界に引き入れてくれた景さんは、技術の発展と時代の変化に伴い、仕事がなくなるのは普通のことであり、タイムリーな調整と計画を思考の中心にすべきだと、善意でアドバイスしてくれました。 しかし、運用・保守部門とその背後にいる人々は、常に廃止の危機に瀕していたが、トンネルの先の光を見て、何度も頑固に復活してきた。彼らはしばしば自分自身を笑い飛ばし、積極的に危機を受け入れ、あえて変化を求めます。振り返ってみると、過去 10 年間のクラウド コンピューティング、クラウド ネイティブ、DevOps、SRE など、これらすべての大きな IT の変化は、「大規模な運用と保守」の分野を継続的に最適化し、改善する試みでした。運用・保守業界は消滅したわけではなく、進化を続け、新たな意味合いを生み出し続けています。 これは何を示しているのでしょうか?これは、運用とメンテナンスが非常に重要であることを示し、また、運用とメンテナンスが難しいことも示しています。しかし、この価値を明確に説明するには、ポジション、目標設定、入出力比率の観点から分析する必要があります。 2. 運用・保守担当者:事業にしっかりと立ち向かうQ: 運用・保守業務の最も重要な目標は何だとお考えですか?これらの目標をどのように達成しましたか?運用と保守の価値をより適切に反映するにはどうすればよいでしょうか? Lai Wei:従来の運用・保守分野に重点を置き、主な職務は次のとおりです。 (1)コードのリリースと配信、価値提供のラストマイルの確保 (2)アーキテクチャのスケーラビリティを向上させて実装する。 (3)システムの信頼性を確保し、継続的に改善する。 (4)最初の3つの目標を達成しながら、システムの運用コスト(finops)を継続的に最適化し、削減する。 あなたの仕事が上記のカテゴリに集中していないことに気付いた場合、2 つの可能性があります。あなたはオペレーターではないか、あなたの仕事が職務の範囲を超えています。 作業範囲、より一般的には運用と保守の使命が明確になると、次のような目標を設定するのは比較的簡単になります。 (1)コードのリリースと配信については、リリース数で単純に測定することができます。 (2)システムの拡張性は拡張の適時性によって測定できる。 (3)安定性については、コア機能が利用できない時間の長さを観察することで測定できます。 (4)システム運用コストについては、各コアトランザクションを完了するためのリソースコストと人件費を計算し、それを表現・追跡することができます。 運用・保守の価値をどのように反映させるかについては、まず私たち運用・保守担当者が変えるべき姿勢と立場があります。私たちはビジネスにしっかりと寄り添い、ビジネス目標を共有するよう努めなければなりません。例を挙げてみましょう。人事部門は、企業内で非常に重要なバックエンド部門です。しかし、私が出会った優秀な人事担当者は、採用担当者であれHRBPであれ、常に自分自身を事業部門の一員とみなし、事業部門の目標を自分の目標とみなしています。みんなが同じスタンスで一つの家族になれば、価値観について語りやすくなります。 第二に、価値の概念は常に「コスト投入」に相対的です。大規模な運用・保守チームを構築し、人件費が社内で非常に目立つようになると、上司の目に「注目の的」となりやすくなり、ビジネス側からもより厳しい課題に直面することになります。諺にあるように、楚の人々は罪がないにもかかわらず、宝物を所有することで罪を犯している。客観的に言えば、運用保守チームのリソース投資はビジネス収益と一致している必要があります。高すぎたり低すぎたりすると不健全となり、チームの発展に役立ちません。したがって、「運用保守の価値創造」は、最終的には運用保守効率の競争に帰着することになります。 最後に、価値については定量的および定性的な説明の両方が必要です。例えば、業界水準との定量的な比較や、社内の事業部門の満足度調査による定量的なデータなどです。企業の戦略的なプロジェクトをサポートする「存在感」などの定性的なデータも必要です。 3. ChatGPTはジュニアオペレーションとメンテナンスのポジションを置き換える可能性があるQ: ChatGPT のような AI 機能は、将来的に運用保守業界の問題を解決できると思いますか? Lai Wei:まず、ChatGPT の主な利点について見てみましょう。 ChatGPT は、知識の豊富さ、自然言語理解 (およびコンテキスト理解)、コンテンツ生成機能の点で、世代を超えたイノベーションをもたらしました。それでは、運用・保守業界の根本的な問題は何かを分析してみましょう。ドメイン知識の不足でしょうか?インタラクション効率は低いですか?コンテンツの出力は難しいですか? 上記のどれでもない。運用・保守業界が扱う問題は、本質的には体系的なエンジニアリングの問題です。これらは、IT システムの迅速な価値提供、拡張性、安定性の問題を解決し、システムの運用と保守の費用対効果を継続的に向上させることを目的としています。 現在、クラウド コンピューティングとマイクロサービスは、運用および保守業界にさらに大きな変化をもたらしています。 ChatGPT は、運用保守業界における知識蓄積の問題を効果的に改善し、すぐに一部のジュニア運用保守アーキテクトのポジションを置き換える可能性があります。 4. 特別テーマ「オブザーバビリティ技術と実践」のハイライト1. Meituan 観測プラットフォーム: 猛禽類の構築と実践美団の技術専門家、任天氏:美団の可観測性プラットフォームであるRaptorは、フロントエンド監視、インフラストラクチャ監視、アプリケーション層監視を統合するだけでなく、企業にインジケーター、リンク、部分的なログ監視機能を提供し、企業が死角なくシステムを監視できるようにします。時間消費検出の観点では、エンドツーエンドのビジネス時間消費、全体的なバックエンド時間消費、ミドルウェア時間消費などをカバーし、ビジネスのすべての段階の可観測性要件を満たします。観測可能なシステムである Raptor は、毎日 PB レベルの監視トラフィックと数百万のアラーム戦略を実行し、フロントエンドとバックエンドの観測機能をカバーし、ビジネスにタイムリーで効果的な観測と早期警告を提供し、ビジネスを護衛します。 この共有は主にRaptorの全体的な観点から始まり、Meituanの可観測性システムの構築パスとアプリケーションの実践、および監視システムCatから可観測性システムRaptorへの進化プロセスを紹介します。また、低レイテンシ、高可用性、低コストというビジネスニーズを満たすために、Meituan の PB レベルの監視データをどのようにサポートするかについても説明します。最後に、現在直面している新たな要求と課題を考慮して、Raptor の次の作業の優先事項と方向性について話し合いました。 2. 障害処理のための可観測性システムの構築Kuaimao Nebula の COO である Qin Xiaohui 氏:サービスの安定性の保証は体系的なプロジェクトです。完全な可観測性システムの構築は安定性保証の基礎であり、安定性保証は可観測性システム サービスにとって最も重要なシナリオでもあります。しかし、企業内には共通の問題点が存在します。さまざまな観測データが利用可能であるにもかかわらず、障害の発見が遅い、障害の位置特定が難しい、障害検出と障害の位置特定での調整が難しいなどの問題が残っています。技術チームは安定性の確保に消極的になることが多いです。多くの企業では、もはやデータが不足しているわけではないかもしれませんが、安定性保証の分野でデータの価値を最大化できる製品、方法、ベストプラクティスが不足しています。 Kuaimao Nebula チームは、エンタープライズ可観測性システムの実装の問題を解決するための 3 つの主要要素 (データ、プラットフォーム、シナリオ) をまとめました。安定性を保証するための観測可能なシステムの構築をおいしい料理を作ることに例えると、データは材料、プラットフォームは調理器具、シナリオは調理技術です。 3. クラウドネイティブ時系列データベースの課題とアーキテクチャ設計GreyTimes の技術担当副社長、Feng Jiachun 氏:企業がクラウドやクラウドネイティブの基本サービスに移行するにつれて、大量のセンサーデータを保存および処理する必要がある時系列データベースもクラウドネイティブ アーキテクチャに移行する必要があります。このプロセスでは多くの課題に直面します。弾力性を考慮して設計された ServerlessDB アーキテクチャ、大量の時系列データを高同時読み取りおよび書き込みする場合の可用性と安定性の課題。時系列データに特有の高カーディナリティおよびデータ圧縮の問題。ストレージとコンピューティングの分離アーキテクチャによってもたらされるパフォーマンス上の課題。時系列と分析の混合負荷によって生じる計算能力の分離とスケジュールの問題。 私たちは、分散型クラウドネイティブの時系列データベースである GreptimeDB を実装する過程でこれらの課題に直面しました。この共有では、設計上の選択とその背後にある考え方を共有します。 上記の興味深いコンテンツは、6 月 16 日から 17 日まで北京で開催される WOT グローバル テクノロジー イノベーション カンファレンスで発表される予定です。 |
<<: ハイブリッドクラウド戦略でデータセンターのコストを管理する方法
>>: ヘルスケア分野ではパブリッククラウドの導入が拡大し続けている
ホスト1プラスKVMVPS朗報です。8 年以上の歴史を持つ企業である host1plus が、ついに...
昨今、オンライン マーケティングが大流行しています。オンライン プロモーションは、投資コストが低く、...
ntup ウクライナのデータセンターの VPS と専用サーバーは、今月中ずっとセール中です。ntup...
韓国は私たちにとって近すぎます。外国の VPS を選択する場合、韓国の VPS を優先する場合があり...
ネットワーク スライシングは、5G が登場するほぼすべての箇所で言及されていますが、その定義は通常曖...
1. 勤勉な編集者のグループ(これについては詳しく説明する必要はありません)。 1.1. フォーラム...
先週、Cloud Native Computing Foundation(CNCF)は、Cilium...
Racknerd は、新しい「3 日間フラッシュ セール」プロモーションを開始しました。これは、3T...
Amazon が最初のクラウド コンピューティング サービスを開始したとき、多額の投資、低い利益、多...
Hosthatchは、オーストラリアのシドニーに、デフォルトの帯域幅10Gbps、KVM仮想化、AM...
[51CTO.com からのオリジナル記事] 今日の企業は、クラウドが必要な理由ではなく、どのクラウ...
ビッグデータの時代では、データストレージが最優先事項となっています。個人ユーザーも企業ユーザーも、デ...
WeTest の紹介 QQ、WeChat、Taobao など、特定のインターネット アプリケーション...
みなさんこんにちは。今月は毎年恒例のダブルイレブンとブラックフライデーが両方あります。みなさんは満足...
ワンダフルライフ社の会長である唐青南氏が警察に連行されたが、フロントで誰かがゲームをしていた。写真は...