Tencent Cloud ビッグデータ チームが Apache コミュニティの新世代分散ストレージ システム Ozone 1.0.0 のリリースを主導

Tencent Cloud ビッグデータ チームが Apache コミュニティの新世代分散ストレージ システム Ozone 1.0.0 のリリースを主導

Tencent Cloud Big Data チームが主導する Ozone 1.0.0 バージョンが、Apache Hadoop コミュニティで正式にリリースされたことがわかりました。コミュニティによる2年以上の継続的な開発と、1,000を超える内部ノードでの実際の実装検証を経て、Ozone 1.0.0は大規模な本番環境に実際に導入できる能力を備えていることがわかりました。

Ozone は、Apache Hadoop コミュニティによって立ち上げられた新世代の分散ストレージ システムです。その登場により、多数の小さなファイルの保存問題が解決され、Hadoop 分散ファイルシステムのスケーラビリティの欠陥が解決されました。 Hadoop エコシステムにおける新しいオブジェクト ストレージ システムとして、数百億、さらには数千億のファイルのストレージをサポートできます。

テンセントクラウドビッグデータチームのオゾンプロジェクトリーダーである陳毅氏は、ビッグデータ分野の大手メーカーとして、テンセントはコミュニティに参加した最初の国内一流インターネット企業であると語った。すでにOzoneプロジェクトにおいて、クラスターネットワークトポロジ認識の開発とデータ書き込みMulti-Raftパイプライン機能の開発をリードしています。同時に、先進的なStorageContainerManager(SCM)高可用性HA機能も開発中です。

オゾンアーキテクチャ図

クラスター ネットワーク トポロジ認識を例にとると、従来のビッグ データ アーキテクチャでは、ネットワーク トポロジ構造を使用して、コンピューティング エンジンのスケジューラがデータに最も近いノードにタスクをスケジュールし、「データ ローカリティ」を実現できます。新たなコンピューティングとストレージの分離アーキテクチャでも、データのフォールト トレランスと高可用性を確保するために、クラスター ネットワーク トポロジ情報が必要です。

陳毅氏はさらに、Ozoneのアルファ版リリース後、テンセントの社内ビッグデータプラットフォームがOzoneプロダクションクラスターを立ち上げ、業務の一部のデータストレージを引き継いだと紹介した。データ サービスの量が増えるにつれて、Ozone の書き込みパフォーマンスに一定の変動とボトルネックがあることが徐々にわかりました。この発見に基づいて、Tencent Ozone プロジェクト チームはデータ書き込み Multi-Raft Pipeline 機能を設計および開発し、Ozone の書き込みスループットとパフォーマンスが大幅に向上しました。

さらに、Ozone の全体的な安定性とパフォーマンスをテストするために、アプリケーション導入の先駆者チームである Tencent は、1,000 個のデータ ノードのクラスターを社内に導入しました。数か月にわたる安定性およびストレステストが実施されました。この期間中、チームは OOM、ノードのクラッシュ、期待を下回るパフォーマンスなど、さまざまな問題に遭遇し、解決しました。包括的な最適化により、1,000 ノードの単一クラスターが長期間安定して稼働できるようになり、すべてのデータが正しいことが検証されました。

バージョン 1.0.0 では、1,000 ノードのクラスターでのテストに加えて、10 億のメタデータ オブジェクトもテストおよび最適化され、長年 HDFS を悩ませてきた多数の小さなファイルの問題がさらに解決されました。現在、Ozone 1.0.0 は、メタデータ ノードのメモリ使用量が 64 GB を超えない範囲で、10 KB の小さなオブジェクト 10 億個の書き込みを簡単にサポートできます。

Ozone と Hive、Spark、Impala などのコンピューティング フレームワークとのシームレスな統合を保証するために、Ozone 1.0.0 は Hive LLAP、Spark、Impala と統合されました。 TPC-DS テストでは、データ サイズが 100 GB と 1 TB の場合、Ozone は HDFS よりも全体的に 3.5% 優れていることが示されています。

継続的なテストと最適化を経て、アップグレードされた Ozone 1.0.0 ではバージョン機能において質的な飛躍が実現しました。 Ozone 1.0.0 は、Hadoop 互換ファイルシステム、Hadoop 2.x、Hadoop3.x 環境のサポートに加えて、Hadoop エコシステムの Kerberos 認証システムとも互換性があり、ユーザーに気付かれずに暗号化されたデータ ストレージと Ranger 認証統合、GDPR「消去権」、およびネットワーク アーキテクチャ認識をサポートします。

今後、テンセントクラウドビッグデータは、自社の技術優位性と蓄積を活かし、OzoneをベースとしたSCMに基づく新世代の高性能分散ファイルシステムを開発し、テンセントのより多くの内外業務へのOzoneの導入を推進し、より大規模な本番クラスターを展開していきます。同時に、オープンソースをさらに推進し、Hadoop コミュニティに深く参加して、Ozone の信頼性、安定性、パフォーマンスを向上させ、新世代のビッグデータ ファイルとオブジェクトのハイブリッド ストレージ システムに構築していきます。

特筆すべきは、Ozoneプロジェクトへの貢献に加え、テンセントのビッグデータチームは近年オープンソース分野での貢献を徐々に加速しており、現在ではコアビッグデータ機能のオープンソース化を完了していることだ。同時に、実際のビジネスシナリオを組み合わせてオープンソース技術の実装を加速し、技術的な実践と革新を通じてコミュニティに還元し、オープンソースに貢献し続けます。 Apache Foundation のビッグデータ プロジェクトでは、Tencent は Hadoop、Spark、Flink などの主流プロジェクトに多数の機能とパッチを提供してきました。


<<:  エッジインテリジェンス: この技術シフトが受け入れられつつある5つの理由

>>:  これらの企業は、ファーウェイのクラウドナレッジコンピューティングソリューションを基盤として、知識の力を解き放ちました。

推薦する

AI、IoTセンサー、ハイブリッドクラウドによるインダストリー4.0の拡張

AI の成熟度が増すということは、あらゆる規模の組織が AI をより簡単に使用して、重大で複雑な問題...

Docin Libraryで外部リンクを構築するためのヒントについて話す

Wenku外部リンクは、外部リンクの非常に一般的な方法であり、非常に高品質の外部リンクです。なぜでし...

インターネットマーケティングとトレンド

電子商取引は、20 世紀の新しい販売モデルです。名前が示すように、電子チャネルを通じてビジネス協力を...

Spring Cloud Function の SpEL インジェクション脆弱性 (CVE-2022-22963) の分析

Akamai の強力なセキュリティ ソリューションの詳細については、こちらをご覧ください。 1. 概...

否定的な批判からイベントマーケティングが成功した理由

昨晩テレビをつけたら、自分の好みに合う番組が見つからず、次々とチャンネルを変えていたら、突然、新しい...

企業ウェブサイトの内部更新におけるよくある問題の分析

私が今日この記事を書いた理由は、ビジネスを最適化する際に記事を更新するときに注意すべき点を友人に伝え...

農夫泉ブランドコンテンツマーケティングの歴史

今号を皮切りに、私たちはすべてのマーケターの参考と学習のために、市場で記憶に残るブランドを継続的に研...

対外貿易ウェブサイトを構築するときに、SEO を行う必要はありますか?最適化技術はありますか?

対外貿易ウェブサイトを構築するときにSEOを行う必要がありますか?このような疑問を持つ販売者は、一般...

クラウドコンピューティングについて語る、Web3.0 Cloud Impact Summit からの素晴らしい見解

5月28日、「Web 3.0クラウドインパクト、新世代クラウドコンピューティングカンファレンス」が北...

エンタープライズクラウドサービスの選択: SaaS、PaaS、IaaSの比較分析

比較的簡単な比較から始めましょう。 今日、クラウド サービスはさらに重要になっています。ほぼすべての...

クラウド移行コストの計算方法

[[398922]]この記事はWeChatの公開アカウント「New Titanium Cloud S...

Google、新しいブックマークサービス「Google Stars」を発表

Google は本日、長らく噂されていたブックマーク サービス「Google Stars」の開始を発...

#黑5# hosthatch: 超大容量ハードディスク搭載VPSを格安で販売、KVM+NMVe VPSも

今年のブラックフライデーとサイバーマンデーのプロモーションであるHosthatchは、特大ハードディ...

Centos6にownCloudをインストールする

ownCloud は、無料でオープンソースであり、個人または商用ストレージの代替ソリューションとして...

推奨に値する 4 つのオープンソース ハイブリッド クラウド プラットフォーム

[[391713]] [51CTO.com クイック翻訳]現在ハイブリッド クラウドを構築する場合、...