5つのビッグデータ処理/データ分析/分散ツール

5つのビッグデータ処理/データ分析/分散ツール

[[241325]]

1. ハドゥープ

Hadoop は、シンプルなプログラミング モデルを使用して、コンピューターのクラスター全体の分散環境でビッグ データを保存および処理できるオープン ソース フレームワークです。単一のサーバーから数千台のマシンまで拡張できるように設計されており、各マシンはローカル コンピューティングとストレージを提供できます。

2. ドルイド

Druid は、リアルタイム データ分析ストレージ システムであり、Java 言語で最高のデータベース接続プールです。 Druid は強力な監視および拡張機能を提供できます。

Druid は、分散型の列指向のリアルタイム分析データ リポジトリであり、マルチテナント環境での探索ダッシュボードを強化するためによく使用されます。

データ ウェアハウス ソリューションとして、Druid はペタバイト規模のデータ セットに対する高速な集約クエリに優れています。 Druid は、さまざまな柔軟なフィルター、正確な計算、近似アルゴリズム、その他の便利な計算をサポートしています。

Druid はストリーミング データとバッチ データの両方をロードでき、Samza、Kafka、Storm、Spark、Hadoop と統合します。

3. アンバリ

ビッグデータプラットフォーム構築・監視ツール。 CDHに類似

Ambari は次のことが可能です。

Hadoopクラスタの提供

  • Ambari は、任意の数のホストに Hadoop サービスをインストールするためのステップバイステップのウィザードを提供します。
  • Ambari はクラスターの Hadoop サービスの構成を処理します。

Hadoop クラスターの管理

  • Ambari は、クラスター全体の Hadoop サービスの開始、停止、再構成を集中管理します。

Hadoop クラスターの監視

  • Ambari は、Hadoop クラスターの健全性とステータスを監視するためのダッシュボードを提供します。
  • Ambari Leverage Ambari Metrics System はメトリックの収集に使用されます。
  • Ambari は、システムアラートに使用され、注意が必要な場合 (ノードがダウンしている、ディスクの残り容量が少ないなど) に通知する Ambari アラート フレームワークを活用します。

4. スパーク

高速かつ汎用的なクラスター コンピューティング システム。 Java、Scala、Python、R の高レベル API と、汎用実行グラフをサポートする最適化されたエンジンを提供します。大規模データ処理フレームワーク (企業における一般的な 3 つのデータ処理シナリオに対応可能: 複雑なバッチ データ処理、履歴データに基づくインタラクティブ クエリ、リアルタイム データ ストリームに基づくデータ処理、Ceph: Linux 分散ファイル システム)。

5. 嵐

Storm は、無料、オープン ソース、分散型、高度なフォールト トレランスを備えたリアルタイム コンピューティング システムです。 Storm は継続的なストリーム コンピューティングを容易にし、Hadoop バッチ処理では満たせないリアルタイム要件を補います。 Storm は、リアルタイム分析、オンライン機械学習、継続的なコンピューティング、分散リモート呼び出し、ETL でよく使用されます。 Storm の導入と管理は非常にシンプルで、同様のストリーミング コンピューティング ツールの中でもパフォーマンスが抜群です。

<<:  質問しながら分散システムのデータシャーディングを学ぶ

>>:  アリババクラウド、重慶市の「アジアで最もスマートな大都市」建設を支援

推薦する

ecovm-$3.5/KVM/512m メモリ/5g SSD/500g トラフィック/G ポート

ecovm は設立されてまだ日が浅い VPS ビジネスです。しかし、iwebserver.ca (1...

estnoc - 36のデータセンター、世界中のVPSデータセンターの大規模なコレクション、必要なものが見つかるかもしれません

2008年に設立されたエストニアのホスティングプロバイダー、estnocの特別紹介。主にVPS、サー...

「建旺2014」は、伝統的なメディア作品を違法に転載するウェブサイトを取り締まる

北京、6月12日(記者張鶴)記者が国家版権局から得た情報によると、国家版権局、中国サイバースペース管...

justgロシアサーバー、cn2 giaライン、物理マシンの簡単なレビュー、justgがどのようになっているかを説明します

ロシアのサーバーは著作権などの管理が緩い場合が多く、特にロシアはヨーロッパとの接続に効果的なので、対...

SEOを学ぶ5つの側面を探る

SEO に直面すると、多くの人が戸惑います。始め方がわからない人、理解できないと思う人、一生懸命努力...

企業ウェブサイトネットワーク編集者のための日常業務標準化ガイドについての簡単な説明

簡単に言えば、ウェブサイト編集者とは、関連する専門知識と、コンピュータやインターネットなどの最新の情...

Microsoft、Alibaba Cloud、Tencent Cloud は多くの問題に直面しています。クラウドコンピューティングの何が問題なのでしょうか?

クラウドコンピューティングは最近かなり話題になっています。 8月5日、Frontier CNCという...

分散ストレージとブロックチェーンの組み合わせはどのような火花を散らすのでしょうか?

最近、工業情報化部と中央サイバースペース安全情報化委員会弁公室は、「ブロックチェーン技術の応用と産業...

クラウド自動化がIT運用を簡素化する7つの方法

クラウド自動化とは、テクノロジーを使用してクラウド コンピューティング環境でアプリケーションとインフ...

クラウド コンピューティング環境におけるストレージの 6 つの必須要素は何ですか?

最近、クラウド コンピューティングに注目が集まっており、ストレージは基盤となるプラットフォームとして...

推奨: buyvm-virtual host 年間支払い 5 ドル / リセラー 年間支払い 20 ドル

Buyvm の仮想ホストがリリースされてから 1 か月以上経ちました。私はおそらくこれを購入した最初...

Qunar.com は Mesos と Docker をベースにしたプライベート クラウド サービスを構築

この記事では、Qunar.com が Mesos と Docker を使用してプライベート クラウド...

文学ウェブサイトの発展における3つのボトルネックを突破する方法

この経済社会において、文学ウェブサイトは結局のところビジネスであり、文学ウェブサイトを運営する最終的...

三国志を例に挙げて分散アルゴリズムについて語るのって、気楽なことでしょうか?

[[357046]]序文「三国殺し」は、中国の三国時代を背景に、身分を手がかりにトランプを形にした...

スマートな教育を推進するインテリジェントな新キャンパス

教育は人々の生活にとって最も重要なプロジェクトであり、「スマートシティ」の中核となる要素です。スマー...