Tencent Cloud ビッグデータ チームが Apache コミュニティの新世代分散ストレージ システム Ozone 1.0.0 のリリースを主導

Tencent Cloud ビッグデータ チームが Apache コミュニティの新世代分散ストレージ システム Ozone 1.0.0 のリリースを主導

Tencent Cloud Big Data チームが主導する Ozone 1.0.0 バージョンが、Apache Hadoop コミュニティで正式にリリースされたことがわかりました。コミュニティによる2年以上の継続的な開発と、1,000を超える内部ノードでの実際の実装検証を経て、Ozone 1.0.0は大規模な本番環境に実際に導入できる能力を備えていることがわかりました。

Ozone は、Apache Hadoop コミュニティによって立ち上げられた新世代の分散ストレージ システムです。その登場により、多数の小さなファイルの保存問題が解決され、Hadoop 分散ファイルシステムのスケーラビリティの欠陥が解決されました。 Hadoop エコシステムにおける新しいオブジェクト ストレージ システムとして、数百億、さらには数千億のファイルのストレージをサポートできます。

テンセントクラウドビッグデータチームのオゾンプロジェクトリーダーである陳毅氏は、ビッグデータ分野の大手メーカーとして、テンセントはコミュニティに参加した最初の国内一流インターネット企業であると語った。すでにOzoneプロジェクトにおいて、クラスターネットワークトポロジ認識の開発とデータ書き込みMulti-Raftパイプライン機能の開発をリードしています。同時に、先進的なStorageContainerManager(SCM)高可用性HA機能も開発中です。

オゾンアーキテクチャ図

クラスター ネットワーク トポロジ認識を例にとると、従来のビッグ データ アーキテクチャでは、ネットワーク トポロジ構造を使用して、コンピューティング エンジンのスケジューラがデータに最も近いノードにタスクをスケジュールし、「データ ローカリティ」を実現できます。新たなコンピューティングとストレージの分離アーキテクチャでも、データのフォールト トレランスと高可用性を確保するために、クラスター ネットワーク トポロジ情報が必要です。

陳毅氏はさらに、Ozoneのアルファ版リリース後、テンセントの社内ビッグデータプラットフォームがOzoneプロダクションクラスターを立ち上げ、業務の一部のデータストレージを引き継いだと紹介した。データ サービスの量が増えるにつれて、Ozone の書き込みパフォーマンスに一定の変動とボトルネックがあることが徐々にわかりました。この発見に基づいて、Tencent Ozone プロジェクト チームはデータ書き込み Multi-Raft Pipeline 機能を設計および開発し、Ozone の書き込みスループットとパフォーマンスが大幅に向上しました。

さらに、Ozone の全体的な安定性とパフォーマンスをテストするために、アプリケーション導入の先駆者チームである Tencent は、1,000 個のデータ ノードのクラスターを社内に導入しました。数か月にわたる安定性およびストレステストが実施されました。この期間中、チームは OOM、ノードのクラッシュ、期待を下回るパフォーマンスなど、さまざまな問題に遭遇し、解決しました。包括的な最適化により、1,000 ノードの単一クラスターが長期間安定して稼働できるようになり、すべてのデータが正しいことが検証されました。

バージョン 1.0.0 では、1,000 ノードのクラスターでのテストに加えて、10 億のメタデータ オブジェクトもテストおよび最適化され、長年 HDFS を悩ませてきた多数の小さなファイルの問題がさらに解決されました。現在、Ozone 1.0.0 は、メタデータ ノードのメモリ使用量が 64 GB を超えない範囲で、10 KB の小さなオブジェクト 10 億個の書き込みを簡単にサポートできます。

Ozone と Hive、Spark、Impala などのコンピューティング フレームワークとのシームレスな統合を保証するために、Ozone 1.0.0 は Hive LLAP、Spark、Impala と統合されました。 TPC-DS テストでは、データ サイズが 100 GB と 1 TB の場合、Ozone は HDFS よりも全体的に 3.5% 優れていることが示されています。

継続的なテストと最適化を経て、アップグレードされた Ozone 1.0.0 ではバージョン機能において質的な飛躍が実現しました。 Ozone 1.0.0 は、Hadoop 互換ファイルシステム、Hadoop 2.x、Hadoop3.x 環境のサポートに加えて、Hadoop エコシステムの Kerberos 認証システムとも互換性があり、ユーザーに気付かれずに暗号化されたデータ ストレージと Ranger 認証統合、GDPR「消去権」、およびネットワーク アーキテクチャ認識をサポートします。

今後、テンセントクラウドビッグデータは、自社の技術優位性と蓄積を活かし、OzoneをベースとしたSCMに基づく新世代の高性能分散ファイルシステムを開発し、テンセントのより多くの内外業務へのOzoneの導入を推進し、より大規模な本番クラスターを展開していきます。同時に、オープンソースをさらに推進し、Hadoop コミュニティに深く参加して、Ozone の信頼性、安定性、パフォーマンスを向上させ、新世代のビッグデータ ファイルとオブジェクトのハイブリッド ストレージ システムに構築していきます。

特筆すべきは、Ozoneプロジェクトへの貢献に加え、テンセントのビッグデータチームは近年オープンソース分野での貢献を徐々に加速しており、現在ではコアビッグデータ機能のオープンソース化を完了していることだ。同時に、実際のビジネスシナリオを組み合わせてオープンソース技術の実装を加速し、技術的な実践と革新を通じてコミュニティに還元し、オープンソースに貢献し続けます。 Apache Foundation のビッグデータ プロジェクトでは、Tencent は Hadoop、Spark、Flink などの主流プロジェクトに多数の機能とパッチを提供してきました。


<<:  エッジインテリジェンス: この技術シフトが受け入れられつつある5つの理由

>>:  これらの企業は、ファーウェイのクラウドナレッジコンピューティングソリューションを基盤として、知識の力を解き放ちました。

推薦する

unixhost: 高品質のウクライナの仮想ホスティングとKVMシリーズVPSを提供

unixhost は 2009 年に設立され、主に仮想ホスティング、VPS、専用サーバーの事業を運営...

福州SEO: SEO初心者とデータアナリストの違いについて簡単に説明します

データ分析の役割は、すべての SEO 担当者にとって自明です。データ分析は、ウェブサイトの運用、ウェ...

Ele.me の Zhang Long: フロントエンド インフラストラクチャ構築への道

[51CTO.comより引用] 2017年12月1日~2日、51CTO主催のWOTDグローバルソフト...

企業のデジタル化に向けた新たな一歩!クラウドオフィスが新たなトレンドに

自宅から出ることなく仕事をしたり、同僚とコミュニケーションをとったり、顧客とやり取りしたりすることが...

クールなサイト評価: ダークなウェブサイトデザイン 22 選

ウェブサイトのデザインでは明るい色が主流ですが、ミステリアスな雰囲気を際立たせ、控えめな高級感を醸し...

仮想現実デバイスOculus:今、未来に衝撃を与える

約10年前、私はQidian Chineseのウェブサイトで初めてオンラインゲーム小説を見ました。こ...

西起胡同における外部リンク構築の盲点を解明

最近、オフサイトのプロモーション作業をいくつか行っていますが、プロモーション中にいくつかの小さな詳細...

Qunar.com の Kubernetes/Ceph ベースの GPU クラウド プラットフォーム プラクティス

[51CTO.comからのオリジナル記事] 今年、ディープラーニング分野で最もホットなニュースは、A...

スノーシーチンチラが語るタレントネットワークシリーズ(I):タレントネットワークの展望と発展

2012 年、ますます多くのウェブマスターがタレント ウェブサイトの仲間入りをして収益を上げ始めまし...

zeptovm - ロシア極東 VPS/大容量帯域幅/月額 5 ドルからの支払い

新興業者のzeptovm(ドメイン名は昨年5月に登録)は、主にVPS事業を運営しており、現在のデータ...

Tik Tokプロモーションスキル:3つのステップと7つのポイント

ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービスいつからか、道路脇に貼っ...

とてもクール! Kafka は Zookeeper を削除しました。

[[396651]]この記事はWeChat公式アカウント「妹の味」から転載したもので、著者は妹が飼っ...

ネットワークプロモーションでは、新人とベテランを区別しません。プロモーションは積極性と蓄積に重点を置いています。

多くの人がオンラインプロモーションを行っており、プロモーションを行う人は皆、エキスパートになることを...

ウェブサイトでキーワードを一括選択するためのヒント

キーワードを選択し、Web ページのキーワード レイアウトを作成することは、すべての SEO 実践者...