5つのビッグデータ処理/データ分析/分散ツール

5つのビッグデータ処理/データ分析/分散ツール

[[241325]]

1. ハドゥープ

Hadoop は、シンプルなプログラミング モデルを使用して、コンピューターのクラスター全体の分散環境でビッグ データを保存および処理できるオープン ソース フレームワークです。単一のサーバーから数千台のマシンまで拡張できるように設計されており、各マシンはローカル コンピューティングとストレージを提供できます。

2. ドルイド

Druid は、リアルタイム データ分析ストレージ システムであり、Java 言語で最高のデータベース接続プールです。 Druid は強力な監視および拡張機能を提供できます。

Druid は、分散型の列指向のリアルタイム分析データ リポジトリであり、マルチテナント環境での探索ダッシュボードを強化するためによく使用されます。

データ ウェアハウス ソリューションとして、Druid はペタバイト規模のデータ セットに対する高速な集約クエリに優れています。 Druid は、さまざまな柔軟なフィルター、正確な計算、近似アルゴリズム、その他の便利な計算をサポートしています。

Druid はストリーミング データとバッチ データの両方をロードでき、Samza、Kafka、Storm、Spark、Hadoop と統合します。

3. アンバリ

ビッグデータプラットフォーム構築・監視ツール。 CDHに類似

Ambari は次のことが可能です。

Hadoopクラスタの提供

  • Ambari は、任意の数のホストに Hadoop サービスをインストールするためのステップバイステップのウィザードを提供します。
  • Ambari はクラスターの Hadoop サービスの構成を処理します。

Hadoop クラスターの管理

  • Ambari は、クラスター全体の Hadoop サービスの開始、停止、再構成を集中管理します。

Hadoop クラスターの監視

  • Ambari は、Hadoop クラスターの健全性とステータスを監視するためのダッシュボードを提供します。
  • Ambari Leverage Ambari Metrics System はメトリックの収集に使用されます。
  • Ambari は、システムアラートに使用され、注意が必要な場合 (ノードがダウンしている、ディスクの残り容量が少ないなど) に通知する Ambari アラート フレームワークを活用します。

4. スパーク

高速かつ汎用的なクラスター コンピューティング システム。 Java、Scala、Python、R の高レベル API と、汎用実行グラフをサポートする最適化されたエンジンを提供します。大規模データ処理フレームワーク (企業における一般的な 3 つのデータ処理シナリオに対応可能: 複雑なバッチ データ処理、履歴データに基づくインタラクティブ クエリ、リアルタイム データ ストリームに基づくデータ処理、Ceph: Linux 分散ファイル システム)。

5. 嵐

Storm は、無料、オープン ソース、分散型、高度なフォールト トレランスを備えたリアルタイム コンピューティング システムです。 Storm は継続的なストリーム コンピューティングを容易にし、Hadoop バッチ処理では満たせないリアルタイム要件を補います。 Storm は、リアルタイム分析、オンライン機械学習、継続的なコンピューティング、分散リモート呼び出し、ETL でよく使用されます。 Storm の導入と管理は非常にシンプルで、同様のストリーミング コンピューティング ツールの中でもパフォーマンスが抜群です。

<<:  質問しながら分散システムのデータシャーディングを学ぶ

>>:  アリババクラウド、重慶市の「アジアで最もスマートな大都市」建設を支援

推薦する

習得すべきウェブサイト最適化の4つの詳細

ウェブサイトの最適化には多くの詳細事項が関係していることは誰もが知っています。これらの細かい詳細は、...

#windows vps# winity-9.6 USD/1g メモリ/40g SSD/1T トラフィック/ロサンゼルス

残り物をいくつか再掲します。今はもうなくなってしまった winity.io VPS ブランドをもう一...

Cisco Maciej Kranz: モノのインターネット時代の成功のルール

[51CTO.com からのオリジナル記事] 25 年前、インターネットが人々の生活に入り込みました...

B2CウェブサイトがSEOを利用してトラフィックを獲得する方法について簡単に説明します。

ご存知のとおり、B2C ウェブサイトは、フォーラムや情報ウェブサイトのように人気を集めて広告を販売し...

raksmartはどうですか? 「本土最適化回線」搭載韓国VPSの評価

raksmartはどうですか? raksmart 韓国 VPS はどうですか?韓国本土の最適化はどう...

2022 年の SaaS のトレンドは何ですか?これらの5つのポイントは注目に値する

近年、デジタルトランスフォーメーションの進展に伴い、企業はビジネスをクラウドに移行し始めています。 ...

Pinduoduo がライブストリーミング販売の試験運用、コンテンツ電子商取引の新たな戦場となるか?

最近、 Pinduoduo の2 つの大きなイベントが大きな注目を集めています。一つは、11月20日...

月間売上高6000万のテンセントのソーシャル広告ゲーム白書に選ばれ、「Huluwa」の広告事例を振り返る

過去1、2年で購買量市場は爆発的に拡大し、今年に入って急速に競争の激しい市場に突入しました。購買量で...

SEO 効率を高めるために大量のウェブサイトのパスワード情報を記憶する方法

SEO 効率を向上させるために、Web サイトのパスワード情報を大量に記憶する方法。大量のウェブサイ...

OpenStack の市場規模はどのくらいですか?

当時の Linux オペレーティング システムと同様に、OpenStack の評判は一夜にして IT...

ウェブマスターとして、サーバーの IIS ログの役割を理解していますか?

サーチャーにとって、サーバーの IIS ログは最適化の参照ログとして非常に重要であり、ここから検索エ...

クラウドネイティブの専門家を採用するのが難しい理由と、彼らの代わりとなる役割を見つける方法

クラウド ネイティブ テクノロジーは、企業がより迅速かつ効率的にソフトウェアを配信できるように支援で...

TinyVZ15ドル/年 VZ、Tinykvm35ドル/年 kvm (Ramhost)、(待望の再入荷)

tinyvzは128MメモリのVZを専門に販売しているramhostのブランドです。 tinykvm...

ウェブマスターツールを照会する際の「リンク」に関連するいくつかの問題

今日、初心者向けの QQ グループでチャットしていたところ、ウェブマスター ツールの使用に関して多く...

Microsoft Data Services は企業のデータ資産の近代化を加速します

[51CTO.com からのオリジナル記事] 2つのセッションが終了し、デジタル構築と開発について熱...