5つのビッグデータ処理/データ分析/分散ツール

5つのビッグデータ処理/データ分析/分散ツール

[[241325]]

1. ハドゥープ

Hadoop は、シンプルなプログラミング モデルを使用して、コンピューターのクラスター全体の分散環境でビッグ データを保存および処理できるオープン ソース フレームワークです。単一のサーバーから数千台のマシンまで拡張できるように設計されており、各マシンはローカル コンピューティングとストレージを提供できます。

2. ドルイド

Druid は、リアルタイム データ分析ストレージ システムであり、Java 言語で最高のデータベース接続プールです。 Druid は強力な監視および拡張機能を提供できます。

Druid は、分散型の列指向のリアルタイム分析データ リポジトリであり、マルチテナント環境での探索ダッシュボードを強化するためによく使用されます。

データ ウェアハウス ソリューションとして、Druid はペタバイト規模のデータ セットに対する高速な集約クエリに優れています。 Druid は、さまざまな柔軟なフィルター、正確な計算、近似アルゴリズム、その他の便利な計算をサポートしています。

Druid はストリーミング データとバッチ データの両方をロードでき、Samza、Kafka、Storm、Spark、Hadoop と統合します。

3. アンバリ

ビッグデータプラットフォーム構築・監視ツール。 CDHに類似

Ambari は次のことが可能です。

Hadoopクラスタの提供

  • Ambari は、任意の数のホストに Hadoop サービスをインストールするためのステップバイステップのウィザードを提供します。
  • Ambari はクラスターの Hadoop サービスの構成を処理します。

Hadoop クラスターの管理

  • Ambari は、クラスター全体の Hadoop サービスの開始、停止、再構成を集中管理します。

Hadoop クラスターの監視

  • Ambari は、Hadoop クラスターの健全性とステータスを監視するためのダッシュボードを提供します。
  • Ambari Leverage Ambari Metrics System はメトリックの収集に使用されます。
  • Ambari は、システムアラートに使用され、注意が必要な場合 (ノードがダウンしている、ディスクの残り容量が少ないなど) に通知する Ambari アラート フレームワークを活用します。

4. スパーク

高速かつ汎用的なクラスター コンピューティング システム。 Java、Scala、Python、R の高レベル API と、汎用実行グラフをサポートする最適化されたエンジンを提供します。大規模データ処理フレームワーク (企業における一般的な 3 つのデータ処理シナリオに対応可能: 複雑なバッチ データ処理、履歴データに基づくインタラクティブ クエリ、リアルタイム データ ストリームに基づくデータ処理、Ceph: Linux 分散ファイル システム)。

5. 嵐

Storm は、無料、オープン ソース、分散型、高度なフォールト トレランスを備えたリアルタイム コンピューティング システムです。 Storm は継続的なストリーム コンピューティングを容易にし、Hadoop バッチ処理では満たせないリアルタイム要件を補います。 Storm は、リアルタイム分析、オンライン機械学習、継続的なコンピューティング、分散リモート呼び出し、ETL でよく使用されます。 Storm の導入と管理は非常にシンプルで、同様のストリーミング コンピューティング ツールの中でもパフォーマンスが抜群です。

<<:  質問しながら分散システムのデータシャーディングを学ぶ

>>:  アリババクラウド、重慶市の「アジアで最もスマートな大都市」建設を支援

推薦する

シングルテナント SaaS アーキテクチャとマルチテナント SaaS アーキテクチャの違いは何ですか?

[51CTO.com クイック翻訳] クラウド サービスはさまざまな分野のさまざまな種類のデータの保...

「ネットをやめた」羅永浩、生放送室で生放送

「離脱」を発表した翌日の6月13日20時18分、スマートイサンテクノロジーの創始者でDouyinのラ...

リンクを使用してキーワードランキングを向上させる方法についての簡単な説明

リンクといえば、誰もが内部リンクと外部リンクを思い浮かべるでしょう。内部リンクと外部リンクはウェブサ...

朗報:iwstack が米国ダラスにデータセンターを開設

Prometeus 傘下の VPS クラウドである iwstack が、ついに米国ダラスのデータセン...

SEO にはウェブサイトの構築方法を学ぶ必要がありますか? SEOとコードの関係について

最近、多くの人が Xuepeng に「SEO には Web サイトの構築方法を学ぶ必要がありますか?...

Weiboマーケティングを利用するTaobao販売者への提案

ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービスSEO担当者として、ウェ...

悲惨な企業ウェブサイトSEO担当者が解雇されたことで浮かんだ思い

結果重視の企業環境では、指定された期限内にタスクを完了できなかった場合、解雇という結果に直面すること...

米国(ロサンゼルス)の無制限 VPS:desivps、最低 $18.99/年、1Gbps 帯域幅、KVM+SSD RAID10

desivps は現在、米国ロサンゼルスのデータセンターで、無制限のトラフィック、1Gbps の帯域...

cloud.net - 5ドル/512Mメモリ/標準ONAPPクラウド/世界中に12のデータセンター

cloud.net は、ONAPP クラウド アーキテクチャに基づくまったく新しいクラウド ホスティ...

WeChatが再びSogou Searchをリリース。テンセントはなぜいつも自社の弱点を利用して他社の強みを攻撃するのでしょうか?

BAT間の競争はインターネット業界の誰もがよく知っている。百度の検索、アリババの電子商取引、テンセン...

私の国のクラウドコンピューティング業界の人材不足は、今後5年間で150万人に達すると予想されています。

今は、大学受験生は願書作成に忙しく、主要大学や専門学校の卒業生にとっては就職に向けた疾走期でもありま...

マルチクラウドとエッジコンピューティングのストレージについて尋ねるべき10の重要な質問

エッジ コンピューティングとクラウド コンピューティングをデータ ストレージと組み合わせることは、非...

SEOの開発とソリューションに立ち向かう

私が初めて SEO に触れたのは 2002 年です。SEO に携わる人なら、2003 年の中国の S...

ユーザーのニーズを満たすプロセスの重要なポイントを特定する: プロダクトマネージャーが必ず読むべき 9 つのステップの方法

私はこの記事を世界を変えることを夢見る人々に捧げますシュ・シュン何年も経って、あの若いプロダクトマネ...

VPS 初心者向けチュートリアル: SolusVM パネルを理解する

HostCat ブログ初心者向けチュートリアル: VPS コントロール パネル solusvm につ...