第7回ビッグデータバッチ処理プラットフォームと分散分析データベーステストの観察

第7回ビッグデータバッチ処理プラットフォームと分散分析データベーステストの観察

2018年12月13日、中国情報通信研究院と中国通信標準化協会が主催し、TC601ビッグデータ技術標準化推進委員会が主催する「2018年データ資産管理カンファレンス」が北京で開催されました。会議では、中国通信標準化協会の戴暁輝常務副秘書長と中国情報通信研究院党委員会の喬法民副書記が共同で、第7回分散バッチ処理プラットフォーム基本機能・性能と分析データベース基本機能・性能評価に合格した15社に認定書を授与した。

ビッグデータ業界のベンチマーク、テスト規模が新たな高水準を記録

4年間の開発を経て、DCAビッグデータ製品能力評価は中国で権威ある評価システムとなり、メーカーの製品開発とユーザーの購入選択の風向計となりました。これまで実施された評価の中で、性能評価のための最大のテストデータセットは100TBに達し、これは世界有数のデータ規模です。分散バッチ処理プラットフォームの基本機能テストの最大クラスターサイズが10,000ノードに達し、Alibaba Cloudによって完了しました。パフォーマンステストのクラスターの最大サイズは300ノードに達し、そのうちHuaweiは300の物理マシンノードのパフォーマンス評価に合格し、Alibaba Cloudは300のクラウドサービスノードのパフォーマンス評価に合格し、H3Cは200の物理マシンノードのパフォーマンス評価に合格しました。

評価プロジェクトは広範囲に及び、評価サービスは信頼性が高く権威がある。

同時に、分散バッチ処理プラットフォームの基本的な機能評価では、可用性、運用・保守管理、互換性、機能性、セキュリティ、マルチテナント性、使いやすさ、スケーラビリティなど、9 つのカテゴリのテスト項目をカバーしています。分析データベースの基本的な機能評価には、機能性、運用と保守、セキュリティ、拡張性、可用性、互換性の 6 つのカテゴリのテスト項目が含まれます。分散バッチ処理プラットフォームのパフォーマンス評価には、SQL 負荷、NoSQL 負荷、機械学習の 3 つの主要項目が含まれます。分析データベースのパフォーマンス評価には、SQL 負荷、混合負荷、ストレス テスト、安定性テストの 4 つの主要項目が含まれます。各カテゴリーの評価項目は広範囲にわたる総合的な側面をカバーしており、業界で最も権威があり信頼性の高い専門的な評価です。

評価結果を詳細に観察して違いを発見し、傾向を分析する

2018年6月から2018年11月まで、Gridsum Technology、Aerospace Star、Tencent Cloud、Nanwei、H3C、Guangzhou Huizhi、Huayu、ZTE、Inspur、Baosight、DreamWorks、Alibaba Cloud、Aerospace Information、Dabao Technology、Baiduなど15社の18製品が、第7回分散バッチ処理プラットフォームの基本機能/性能および分析データベースの基本機能/性能評価に参加しました。全体的な評価から、次のようなことが言えます。

分散バッチ処理プラットフォームの基本的な機能に関しては、製品は成熟しており安定しています。全体として、製品の 71% は HDP および CDH のオープン ソース バージョンに基づいて二次開発されており、残りはオープン ソース コミュニティ バージョンに基づいているか、完全に自社開発されています。同時に、コンテナ化、AI のサポート、大規模クラスターのサポートは、分散バッチ処理プラットフォームの主なトレンドです。分析データベースの基本的な機能に関しては、製品のアーキテクチャと機能が大きく異なります。 1 つは、オープンソース データベースをベースにカプセル化して二次開発を行う方法です。もう 1 つのタイプは、SQL エンジンを特定のリポジトリに移植することです。また、完全に自社開発の製品もございます。機能上の違いは主に、SQL の互換性、運用・保守管理、スケーラビリティなどの面で反映されます。分散バッチ処理プラットフォームのパフォーマンスに関しては、基本的に上半期の第6回テストと同じです。 SQL テストの最高スコアと中央値はわずかに低下し、HBase テストの結果は概ね前回のバッチに近いものとなっています。分析データベースのパフォーマンスに関しては、Gridsum Technology は優れた結果を達成し、このバッチで MPP パフォーマンス評価に合格した唯一の企業となりました。

注: MPP (Massively Parallel Processing) は、複数のプロセッサが同じプログラムの異なる部分を処理し、各プロセッサが独自のオペレーティング システムとメモリを使用するプログラムの調整プロセスです。

<<:  クラウドサービスの10年: BAT、Amazon、Googleの楽しい争い

>>:  楊磊氏との対談:「究極のシンプルさ」と「究極の真実」でユーザーにとっての価値を継続的に創造する

推薦する

yourserver: 新しい KVM シリーズ、月額 5 ユーロから、ラトビア/スウェーデン、1Gbps の帯域幅、無制限のトラフィック

ラトビアの VPS プロバイダー yourserver は、KVM シリーズが現在運用可能であること...

SEO 外部リンク - ソフトウェア外部リンクと手動外部リンク

ウェブサイトを構築する友人は皆、外部リンクの重要性を知っているので、ウェブサイトの最初から外部リンク...

ウェブマスターネットワークニュース:電子商取引が生鮮食品市場に参入、アリランが「クラウドキャット」を発売

1. 電子商取引が「コールドチェーン」の欠点を補うために生鮮食品市場に参入電子商取引は「コールドチェ...

タレントサイトの運営における虚偽の要求とは?

どの業界にも発展の焦点と需要の方向があります。業界で成功を収めることができるのは、自社のリソースを合...

オープンソースの分散ストリームストレージ Pravega が必要な理由は何ですか?

[[254700]]産業用 IoT、自動車のインターネット、リアルタイムの不正リスク管理に対する需要...

フォーラム マーケティングの 3 つの要素: 人、ホット スポット、チャネル

以前、「フォーラム マーケティングの特徴とは何か」というタイトルの記事を書きました。この記事では、フ...

2014年第1四半期、台湾のドメイン名の総数は95.7%増加し、純増は1,201件となった。

IDC Review Network (idcps.com) は 4 月 15 日に次のように報告し...

クラウドコンピューティングのオンデマンド利用を実現する方法

クラウド コンピューティングが成熟するにつれて、従来のオフライン シナリオに存在する問題を解決するた...

李佳琦は1日で10億を売り上げた?その背後にある論理!

李佳琦のライブ放送を待っていましたか?もしそうなら、何かを買いたいという衝動を抑えられなかったと思い...

Python エンベロープを使用してメールと添付ファイルを送信する

昨年、私は smtplib を使用して電子メールを送信する方法についての記事を書きましたが、友人から...

IDC: 中国のEA SaaS市場規模は2026年に183.1億米ドルに達する

IDCの最新の「IDC中国エンタープライズアプリケーション管理(EA)SaaS市場2021年下半期追...

インターネット上でブランドアーキテクチャを定義する方法

ブランドは、私たち一人ひとりにとって、大なり小なり意味を持つ定義です。なぜなら、Web サイトを作成...

ウェブサイトの詳細を改善する方法

ウェブサイトの詳細を改善する方法まず、1 つの質問を理解する必要があります。Web サイトの詳細を完...

料金が高ければ高いほど、顧客は満足します。別の視点から価格設定を見てみましょう。

この記事は、2012 年 9 月 21 日にパトリックが自身のブログで公開したものです。会話の音声版...

私は自分のニッチを誇りに思っています。インターネットニッチ製品にも独自の春があります

ニッチ製品の将来については楽観的ではないと言う人もいます。一部のニッチ製品の創造性とデザインを心から...