5つのビッグデータ処理/データ分析/分散ツール

5つのビッグデータ処理/データ分析/分散ツール

[[241325]]

1. ハドゥープ

Hadoop は、シンプルなプログラミング モデルを使用して、コンピューターのクラスター全体の分散環境でビッグ データを保存および処理できるオープン ソース フレームワークです。単一のサーバーから数千台のマシンまで拡張できるように設計されており、各マシンはローカル コンピューティングとストレージを提供できます。

2. ドルイド

Druid は、リアルタイム データ分析ストレージ システムであり、Java 言語で最高のデータベース接続プールです。 Druid は強力な監視および拡張機能を提供できます。

Druid は、分散型の列指向のリアルタイム分析データ リポジトリであり、マルチテナント環境での探索ダッシュボードを強化するためによく使用されます。

データ ウェアハウス ソリューションとして、Druid はペタバイト規模のデータ セットに対する高速な集約クエリに優れています。 Druid は、さまざまな柔軟なフィルター、正確な計算、近似アルゴリズム、その他の便利な計算をサポートしています。

Druid はストリーミング データとバッチ データの両方をロードでき、Samza、Kafka、Storm、Spark、Hadoop と統合します。

3. アンバリ

ビッグデータプラットフォーム構築・監視ツール。 CDHに類似

Ambari は次のことが可能です。

Hadoopクラスタの提供

  • Ambari は、任意の数のホストに Hadoop サービスをインストールするためのステップバイステップのウィザードを提供します。
  • Ambari はクラスターの Hadoop サービスの構成を処理します。

Hadoop クラスターの管理

  • Ambari は、クラスター全体の Hadoop サービスの開始、停止、再構成を集中管理します。

Hadoop クラスターの監視

  • Ambari は、Hadoop クラスターの健全性とステータスを監視するためのダッシュボードを提供します。
  • Ambari Leverage Ambari Metrics System はメトリックの収集に使用されます。
  • Ambari は、システムアラートに使用され、注意が必要な場合 (ノードがダウンしている、ディスクの残り容量が少ないなど) に通知する Ambari アラート フレームワークを活用します。

4. スパーク

高速かつ汎用的なクラスター コンピューティング システム。 Java、Scala、Python、R の高レベル API と、汎用実行グラフをサポートする最適化されたエンジンを提供します。大規模データ処理フレームワーク (企業における一般的な 3 つのデータ処理シナリオに対応可能: 複雑なバッチ データ処理、履歴データに基づくインタラクティブ クエリ、リアルタイム データ ストリームに基づくデータ処理、Ceph: Linux 分散ファイル システム)。

5. 嵐

Storm は、無料、オープン ソース、分散型、高度なフォールト トレランスを備えたリアルタイム コンピューティング システムです。 Storm は継続的なストリーム コンピューティングを容易にし、Hadoop バッチ処理では満たせないリアルタイム要件を補います。 Storm は、リアルタイム分析、オンライン機械学習、継続的なコンピューティング、分散リモート呼び出し、ETL でよく使用されます。 Storm の導入と管理は非常にシンプルで、同様のストリーミング コンピューティング ツールの中でもパフォーマンスが抜群です。

<<:  質問しながら分散システムのデータシャーディングを学ぶ

>>:  アリババクラウド、重慶市の「アジアで最もスマートな大都市」建設を支援

推薦する

Fanyun:米国のcn2高防御クラウドサーバー、拡張クラウドディスクをサポート、50Gの高防御が付属、月額40元から

国内の業者「Fanyun」のロサンゼルスVPSには、cn2ネットワーク、拡張可能なクラウドディスク、...

群集心理に基づく SEO 最適化の効果は良くない - A5 Webmaster Network

Baidu は新たな変更を加えました。検索結果を収集、共有、報告できるようになりました。これは LE...

Vancl は「帰路」で何をしたいのでしょうか?

昨年第4四半期に黒字を達成したヴァンクルにとって、今年のプレッシャーは依然として非常に大きい。チュー...

ラップ「言葉にできない」ノード - $6/kvm/512m メモリ/25g ハードディスク/500g トラフィック/ロサンゼルス/DDoS 保護/最適化された回線

ラップ「Unspeakable」のノードをチェックしてみましたが、情報を見つけることができませんでし...

Baidu によってウェブサイトが降格され、通常のランキングに戻らない状況にどう対処すればよいですか?

6月22日の早朝、多くのウェブマスターがサイトのKステーションと重量の低下、またはホームページのスナ...

#黑5# cmivps: 香港VPS生涯30%オフ、香港独立サーバー生涯10%オフ、モバイルアクセスが特に良い

cmivps は今年、大規模なブラックフライデー プロモーションを実施しました。香港のデータ センタ...

ウェブサイトの内部リンクをうまく活用する方法のまとめ

外部リンクが王様で、内部リンクが最も重要だと言われています。では、ウェブサイトで内部リンクをうまく活...

大規模アプリケーションのパフォーマンスの課題を克服するにはどうすればよいでしょうか?

[51CTO.com クイック翻訳] Web スケールのアプリケーションでは、優れたユーザー エクス...

SEOサイト全体の最適化と従来のキーワード最適化の違い

サイト全体の最適化とはSEO 最適化は、ウェブサイト最適化とも呼ばれ、検索エンジンのランキング ルー...

MongoDB Atlas がマルチクラウド データベース クラスターをサポートするようになりました

新しい MongoDB Atlas マルチクラウド クラスター機能は火曜日に一般提供が開始され、同社...

外部リンクを投稿する際に従うべき3つの原則について

私は外部リンクの掲載にかなりの経験があります。外部リンクはウェブサイトの最適化に非常に良い効果をもた...

ウェブマスターネットワークからの毎日のレポート:ビデオネットワークが広告時間を倍増、Tmallが書籍戦争に参入

1. 動画サイトでの資金の浪費のプレッシャーは緩和が難しい:広告時間を静かに倍増6月12日早朝のニュ...

最新の! 2019年中国のデジタルユーザー成長行動の年次分析

2019年、モバイルインターネットユーザー数は10億人を突破しました。トラフィック配当がピークを迎え...

360 と Baidu の戦いの長所と短所の分析 360 百科事典

360とBaiduの間の「3B戦争」はようやく沈静化したが、現在再燃の兆しを見せている。 1月5日、...