1. ハドゥープ Hadoop は、シンプルなプログラミング モデルを使用して、コンピューターのクラスター全体の分散環境でビッグ データを保存および処理できるオープン ソース フレームワークです。単一のサーバーから数千台のマシンまで拡張できるように設計されており、各マシンはローカル コンピューティングとストレージを提供できます。 2. ドルイド Druid は、リアルタイム データ分析ストレージ システムであり、Java 言語で最高のデータベース接続プールです。 Druid は強力な監視および拡張機能を提供できます。 Druid は、分散型の列指向のリアルタイム分析データ リポジトリであり、マルチテナント環境での探索ダッシュボードを強化するためによく使用されます。 データ ウェアハウス ソリューションとして、Druid はペタバイト規模のデータ セットに対する高速な集約クエリに優れています。 Druid は、さまざまな柔軟なフィルター、正確な計算、近似アルゴリズム、その他の便利な計算をサポートしています。 Druid はストリーミング データとバッチ データの両方をロードでき、Samza、Kafka、Storm、Spark、Hadoop と統合します。 3. アンバリ ビッグデータプラットフォーム構築・監視ツール。 CDHに類似 Ambari は次のことが可能です。 Hadoopクラスタの提供
Hadoop クラスターの管理
Hadoop クラスターの監視
4. スパーク 高速かつ汎用的なクラスター コンピューティング システム。 Java、Scala、Python、R の高レベル API と、汎用実行グラフをサポートする最適化されたエンジンを提供します。大規模データ処理フレームワーク (企業における一般的な 3 つのデータ処理シナリオに対応可能: 複雑なバッチ データ処理、履歴データに基づくインタラクティブ クエリ、リアルタイム データ ストリームに基づくデータ処理、Ceph: Linux 分散ファイル システム)。 5. 嵐 Storm は、無料、オープン ソース、分散型、高度なフォールト トレランスを備えたリアルタイム コンピューティング システムです。 Storm は継続的なストリーム コンピューティングを容易にし、Hadoop バッチ処理では満たせないリアルタイム要件を補います。 Storm は、リアルタイム分析、オンライン機械学習、継続的なコンピューティング、分散リモート呼び出し、ETL でよく使用されます。 Storm の導入と管理は非常にシンプルで、同様のストリーミング コンピューティング ツールの中でもパフォーマンスが抜群です。 |
<<: 質問しながら分散システムのデータシャーディングを学ぶ
>>: アリババクラウド、重慶市の「アジアで最もスマートな大都市」建設を支援
[51CTO.com クイック翻訳] クラウド サービスはさまざまな分野のさまざまな種類のデータの保...
「離脱」を発表した翌日の6月13日20時18分、スマートイサンテクノロジーの創始者でDouyinのラ...
リンクといえば、誰もが内部リンクと外部リンクを思い浮かべるでしょう。内部リンクと外部リンクはウェブサ...
Prometeus 傘下の VPS クラウドである iwstack が、ついに米国ダラスのデータセン...
最近、多くの人が Xuepeng に「SEO には Web サイトの構築方法を学ぶ必要がありますか?...
ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービスSEO担当者として、ウェ...
結果重視の企業環境では、指定された期限内にタスクを完了できなかった場合、解雇という結果に直面すること...
desivps は現在、米国ロサンゼルスのデータセンターで、無制限のトラフィック、1Gbps の帯域...
cloud.net は、ONAPP クラウド アーキテクチャに基づくまったく新しいクラウド ホスティ...
BAT間の競争はインターネット業界の誰もがよく知っている。百度の検索、アリババの電子商取引、テンセン...
今は、大学受験生は願書作成に忙しく、主要大学や専門学校の卒業生にとっては就職に向けた疾走期でもありま...
エッジ コンピューティングとクラウド コンピューティングをデータ ストレージと組み合わせることは、非...
私が初めて SEO に触れたのは 2002 年です。SEO に携わる人なら、2003 年の中国の S...
私はこの記事を世界を変えることを夢見る人々に捧げますシュ・シュン何年も経って、あの若いプロダクトマネ...
HostCat ブログ初心者向けチュートリアル: VPS コントロール パネル solusvm につ...