第7回ビッグデータバッチ処理プラットフォームと分散分析データベーステストの観察

第7回ビッグデータバッチ処理プラットフォームと分散分析データベーステストの観察

2018年12月13日、中国情報通信研究院と中国通信標準化協会が主催し、TC601ビッグデータ技術標準化推進委員会が主催する「2018年データ資産管理カンファレンス」が北京で開催されました。会議では、中国通信標準化協会の戴暁輝常務副秘書長と中国情報通信研究院党委員会の喬法民副書記が共同で、第7回分散バッチ処理プラットフォーム基本機能・性能と分析データベース基本機能・性能評価に合格した15社に認定書を授与した。

ビッグデータ業界のベンチマーク、テスト規模が新たな高水準を記録

4年間の開発を経て、DCAビッグデータ製品能力評価は中国で権威ある評価システムとなり、メーカーの製品開発とユーザーの購入選択の風向計となりました。これまで実施された評価の中で、性能評価のための最大のテストデータセットは100TBに達し、これは世界有数のデータ規模です。分散バッチ処理プラットフォームの基本機能テストの最大クラスターサイズが10,000ノードに達し、Alibaba Cloudによって完了しました。パフォーマンステストのクラスターの最大サイズは300ノードに達し、そのうちHuaweiは300の物理マシンノードのパフォーマンス評価に合格し、Alibaba Cloudは300のクラウドサービスノードのパフォーマンス評価に合格し、H3Cは200の物理マシンノードのパフォーマンス評価に合格しました。

評価プロジェクトは広範囲に及び、評価サービスは信頼性が高く権威がある。

同時に、分散バッチ処理プラットフォームの基本的な機能評価では、可用性、運用・保守管理、互換性、機能性、セキュリティ、マルチテナント性、使いやすさ、スケーラビリティなど、9 つのカテゴリのテスト項目をカバーしています。分析データベースの基本的な機能評価には、機能性、運用と保守、セキュリティ、拡張性、可用性、互換性の 6 つのカテゴリのテスト項目が含まれます。分散バッチ処理プラットフォームのパフォーマンス評価には、SQL 負荷、NoSQL 負荷、機械学習の 3 つの主要項目が含まれます。分析データベースのパフォーマンス評価には、SQL 負荷、混合負荷、ストレス テスト、安定性テストの 4 つの主要項目が含まれます。各カテゴリーの評価項目は広範囲にわたる総合的な側面をカバーしており、業界で最も権威があり信頼性の高い専門的な評価です。

評価結果を詳細に観察して違いを発見し、傾向を分析する

2018年6月から2018年11月まで、Gridsum Technology、Aerospace Star、Tencent Cloud、Nanwei、H3C、Guangzhou Huizhi、Huayu、ZTE、Inspur、Baosight、DreamWorks、Alibaba Cloud、Aerospace Information、Dabao Technology、Baiduなど15社の18製品が、第7回分散バッチ処理プラットフォームの基本機能/性能および分析データベースの基本機能/性能評価に参加しました。全体的な評価から、次のようなことが言えます。

分散バッチ処理プラットフォームの基本的な機能に関しては、製品は成熟しており安定しています。全体として、製品の 71% は HDP および CDH のオープン ソース バージョンに基づいて二次開発されており、残りはオープン ソース コミュニティ バージョンに基づいているか、完全に自社開発されています。同時に、コンテナ化、AI のサポート、大規模クラスターのサポートは、分散バッチ処理プラットフォームの主なトレンドです。分析データベースの基本的な機能に関しては、製品のアーキテクチャと機能が大きく異なります。 1 つは、オープンソース データベースをベースにカプセル化して二次開発を行う方法です。もう 1 つのタイプは、SQL エンジンを特定のリポジトリに移植することです。また、完全に自社開発の製品もございます。機能上の違いは主に、SQL の互換性、運用・保守管理、スケーラビリティなどの面で反映されます。分散バッチ処理プラットフォームのパフォーマンスに関しては、基本的に上半期の第6回テストと同じです。 SQL テストの最高スコアと中央値はわずかに低下し、HBase テストの結果は概ね前回のバッチに近いものとなっています。分析データベースのパフォーマンスに関しては、Gridsum Technology は優れた結果を達成し、このバッチで MPP パフォーマンス評価に合格した唯一の企業となりました。

注: MPP (Massively Parallel Processing) は、複数のプロセッサが同じプログラムの異なる部分を処理し、各プロセッサが独自のオペレーティング システムとメモリを使用するプログラムの調整プロセスです。

<<:  クラウドサービスの10年: BAT、Amazon、Googleの楽しい争い

>>:  楊磊氏との対談:「究極のシンプルさ」と「究極の真実」でユーザーにとっての価値を継続的に創造する

推薦する

Baidu の手動介入がユーザーの検索エクスペリエンスをどのように改善するか、2 人の「Mo Yan」から

最近、中国の作家、莫言がノーベル文学賞を受賞したというニュースがあちこちで報じられている。 SEO担...

hostkvm: 生涯 25% オフ、香港 VPS + シンガポール VPS、トラフィック サポート

Hostkvm からメッセージが届きました: ウェブサイトが刷新され、新しい香港 VPS のトラフィ...

3つの大きな動きがeLong.comに大きな打撃を与え、行き詰まりに近づいている

eLongの2013年度の財務報告は芳しいものではなかった。純損失は1億6800万元で、2009年に...

ウェブサイトのデータ分析と収集を簡単に完了する5つのステップ

ウェブサイトや製品の運用については、孤立した状態や紙の上だけで議論することはできず、実際のデータに基...

Namecheap - ドメイン名 5 年 $5.58、ホスティング初年度 $9.98、サーバー $58.98

今後、Namecheapではさまざまな商品を販売しており、その中には[1]ドメイン名、16種類のドメ...

パブリッククラウド市場の状況について、私はこれら2つの権威あるレポートに「先導」されました

2020 年のクラウド コンピューティング市場は全体として「クラウドへの急成長」と言えますが、過去 ...

Zheye: ゴールデン 10 月、20% オフ プロモーション、VPS+サーバー: 日本\香港\シンガポール\米国

Zheye IO: 10 月のプロモーション、全アイテムが 20% オフ、更新時も同じ価格、VPS ...

ウェブサイトの内部リンク戦略

ウェブサイトの内部リンクの最適化とは何ですか? 1. ウェブサイトのナビゲーションウェブサイトのナビ...

インターネットマーケティング前の準備

マーケティングを行うということはコミュニケーションを取ることであり、コミュニケーションを取るためには...

Googleはクラウドコンピューティングの顧客向けにGemini Proを公開すると発表、開発者はアプリケーションの構築に利用できる

12月14日水曜日(米国時間)、Googleはクラウドコンピューティングの顧客により良いサービスを提...

SaaS資産の40%がデータ侵害のリスクにさらされている

DoControl が最近発表したレポートによると、今日の企業では管理されていないデータが大量に存在...

JVM の詳細な分析: JVM はリフレクションをどのように実装しますか?

[[422686]]リフレクションは Java 言語の非常に重要な機能であり、実行中の Java プ...

検索エンジンマーケティングの価値を高めるためにフローとコンバージョン率を把握する

今日のオンライン顧客マーケティングの発展から利益を得たい場合、何をすべきでしょうか? この問題を解決...

外部リンクを使用してウェブサイトのランキングを安定させる方法

私は、気づかないうちにウェブマスターになって4年近くになります。何も知らない初心者から始めました。毎...

新しいウェブサイトを成功させる方法

昨年、百度がスパムサイトを厳しく取り締まり始めて以来、百度が新しいサイトに対して課す基準がどんどん高...