Tencent Cloud ビッグデータ チームが Apache コミュニティの新世代分散ストレージ システム Ozone 1.0.0 のリリースを主導

Tencent Cloud ビッグデータ チームが Apache コミュニティの新世代分散ストレージ システム Ozone 1.0.0 のリリースを主導

Tencent Cloud Big Data チームが主導する Ozone 1.0.0 バージョンが、Apache Hadoop コミュニティで正式にリリースされたことがわかりました。コミュニティによる2年以上の継続的な開発と、1,000を超える内部ノードでの実際の実装検証を経て、Ozone 1.0.0は大規模な本番環境に実際に導入できる能力を備えていることがわかりました。

Ozone は、Apache Hadoop コミュニティによって立ち上げられた新世代の分散ストレージ システムです。その登場により、多数の小さなファイルの保存問題が解決され、Hadoop 分散ファイルシステムのスケーラビリティの欠陥が解決されました。 Hadoop エコシステムにおける新しいオブジェクト ストレージ システムとして、数百億、さらには数千億のファイルのストレージをサポートできます。

テンセントクラウドビッグデータチームのオゾンプロジェクトリーダーである陳毅氏は、ビッグデータ分野の大手メーカーとして、テンセントはコミュニティに参加した最初の国内一流インターネット企業であると語った。すでにOzoneプロジェクトにおいて、クラスターネットワークトポロジ認識の開発とデータ書き込みMulti-Raftパイプライン機能の開発をリードしています。同時に、先進的なStorageContainerManager(SCM)高可用性HA機能も開発中です。

オゾンアーキテクチャ図

クラスター ネットワーク トポロジ認識を例にとると、従来のビッグ データ アーキテクチャでは、ネットワーク トポロジ構造を使用して、コンピューティング エンジンのスケジューラがデータに最も近いノードにタスクをスケジュールし、「データ ローカリティ」を実現できます。新たなコンピューティングとストレージの分離アーキテクチャでも、データのフォールト トレランスと高可用性を確保するために、クラスター ネットワーク トポロジ情報が必要です。

陳毅氏はさらに、Ozoneのアルファ版リリース後、テンセントの社内ビッグデータプラットフォームがOzoneプロダクションクラスターを立ち上げ、業務の一部のデータストレージを引き継いだと紹介した。データ サービスの量が増えるにつれて、Ozone の書き込みパフォーマンスに一定の変動とボトルネックがあることが徐々にわかりました。この発見に基づいて、Tencent Ozone プロジェクト チームはデータ書き込み Multi-Raft Pipeline 機能を設計および開発し、Ozone の書き込みスループットとパフォーマンスが大幅に向上しました。

さらに、Ozone の全体的な安定性とパフォーマンスをテストするために、アプリケーション導入の先駆者チームである Tencent は、1,000 個のデータ ノードのクラスターを社内に導入しました。数か月にわたる安定性およびストレステストが実施されました。この期間中、チームは OOM、ノードのクラッシュ、期待を下回るパフォーマンスなど、さまざまな問題に遭遇し、解決しました。包括的な最適化により、1,000 ノードの単一クラスターが長期間安定して稼働できるようになり、すべてのデータが正しいことが検証されました。

バージョン 1.0.0 では、1,000 ノードのクラスターでのテストに加えて、10 億のメタデータ オブジェクトもテストおよび最適化され、長年 HDFS を悩ませてきた多数の小さなファイルの問題がさらに解決されました。現在、Ozone 1.0.0 は、メタデータ ノードのメモリ使用量が 64 GB を超えない範囲で、10 KB の小さなオブジェクト 10 億個の書き込みを簡単にサポートできます。

Ozone と Hive、Spark、Impala などのコンピューティング フレームワークとのシームレスな統合を保証するために、Ozone 1.0.0 は Hive LLAP、Spark、Impala と統合されました。 TPC-DS テストでは、データ サイズが 100 GB と 1 TB の場合、Ozone は HDFS よりも全体的に 3.5% 優れていることが示されています。

継続的なテストと最適化を経て、アップグレードされた Ozone 1.0.0 ではバージョン機能において質的な飛躍が実現しました。 Ozone 1.0.0 は、Hadoop 互換ファイルシステム、Hadoop 2.x、Hadoop3.x 環境のサポートに加えて、Hadoop エコシステムの Kerberos 認証システムとも互換性があり、ユーザーに気付かれずに暗号化されたデータ ストレージと Ranger 認証統合、GDPR「消去権」、およびネットワーク アーキテクチャ認識をサポートします。

今後、テンセントクラウドビッグデータは、自社の技術優位性と蓄積を活かし、OzoneをベースとしたSCMに基づく新世代の高性能分散ファイルシステムを開発し、テンセントのより多くの内外業務へのOzoneの導入を推進し、より大規模な本番クラスターを展開していきます。同時に、オープンソースをさらに推進し、Hadoop コミュニティに深く参加して、Ozone の信頼性、安定性、パフォーマンスを向上させ、新世代のビッグデータ ファイルとオブジェクトのハイブリッド ストレージ システムに構築していきます。

特筆すべきは、Ozoneプロジェクトへの貢献に加え、テンセントのビッグデータチームは近年オープンソース分野での貢献を徐々に加速しており、現在ではコアビッグデータ機能のオープンソース化を完了していることだ。同時に、実際のビジネスシナリオを組み合わせてオープンソース技術の実装を加速し、技術的な実践と革新を通じてコミュニティに還元し、オープンソースに貢献し続けます。 Apache Foundation のビッグデータ プロジェクトでは、Tencent は Hadoop、Spark、Flink などの主流プロジェクトに多数の機能とパッチを提供してきました。


<<:  エッジインテリジェンス: この技術シフトが受け入れられつつある5つの理由

>>:  これらの企業は、ファーウェイのクラウドナレッジコンピューティングソリューションを基盤として、知識の力を解き放ちました。

推薦する

VPS格安販売業者、最も安いVPS

VPS を使用する顧客はレベルが異なり、目的も多様であるため、一部の友人は VPS に対して特に高い...

独立系ブロガーがすぐに有名ブロガーに成長するための最適な「パスワード」を簡単に分析

独立系ブログといえば、誰もが必ず月光ブログ、陸松松ブログ、牟長青ブログ、Zacブログなど、よく訪問し...

Quickpacket ラスベガス VPS シンプルレビュー (Xen 512 メモリ)

私は、Fiberhub ラスベガス データ センターで、XEN 仮想化に基づく QuickPacke...

コンテナクラウドドッキングと永続ストレージの使用

コンテナはインターネット アプリケーションのアジャイル開発と迅速な配信を実現するため、従来の金融 I...

クラウドで DevOps の担当者がクラッシュするのはなぜですか?

DevOps とクラウドは、どちらも「弾力性と俊敏性」、「サービスとしてのソフトウェア」、「ソフトウ...

イベントマーケティングを活性化させる核となるステップ

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています情報技術の...

Host1plus ロサンゼルス VPS 4 ヶ月使用後のレビュー

2018年6月1日、私はhost1plusのロサンゼルスデータセンターでopenvz仮想化に基づく6...

raksmart Japan CN2回線クラウドサーバーの簡単なレビュー

raksmart Japanはどうですか? raksmart Japanのクラウドサーバーはいかがで...

競争が激化するクラウド市場において、Amazon Web Services は「顧客第一」をどのように捉えているのでしょうか?

[51CTO.comからのオリジナル記事] エンタープライズITサービス分野では、ユーザーに「満足」...

2012年の5度の苦難の時期を経て、共同購入は安定: ウェブサイトの数はほぼ半減

業界の偽りの繁栄を経験した後、共同購入は徐々に混乱から抜け出し、昨年は安定した状態になりました。共同...

Alibaba Cloud と Tencent Cloud: 中国のパブリッククラウド市場の競争環境を考察

まず第一に、タイトルが少々クリックベイト的であることを認めなければなりません。タイトルは単なる仕掛け...

Baidu のリマインダー ツールは月に 1 回届きますが、残りの 29 日間はどうなりますか?

最近、Baidu Webmaster Platformはハッキングリマインダーと不正行為リマインダー...

Mob Lin Rongbo: データファクトリーアーキテクチャのアップグレードについて再考

[51CTO.comより引用] 2018年5月18日〜19日、51CTO主催のグローバルソフトウェア...

AppleはiOS 6で新しいマッピング技術を取得する予定と報じられている

Google のマップデータスイッチボードから離れた社内ソリューションは、Apple にとって差し迫...