1. ハドゥープ Hadoop は、シンプルなプログラミング モデルを使用して、コンピューターのクラスター全体の分散環境でビッグ データを保存および処理できるオープン ソース フレームワークです。単一のサーバーから数千台のマシンまで拡張できるように設計されており、各マシンはローカル コンピューティングとストレージを提供できます。 2. ドルイド Druid は、リアルタイム データ分析ストレージ システムであり、Java 言語で最高のデータベース接続プールです。 Druid は強力な監視および拡張機能を提供できます。 Druid は、分散型の列指向のリアルタイム分析データ リポジトリであり、マルチテナント環境での探索ダッシュボードを強化するためによく使用されます。 データ ウェアハウス ソリューションとして、Druid はペタバイト規模のデータ セットに対する高速な集約クエリに優れています。 Druid は、さまざまな柔軟なフィルター、正確な計算、近似アルゴリズム、その他の便利な計算をサポートしています。 Druid はストリーミング データとバッチ データの両方をロードでき、Samza、Kafka、Storm、Spark、Hadoop と統合します。 3. アンバリ ビッグデータプラットフォーム構築・監視ツール。 CDHに類似 Ambari は次のことが可能です。 Hadoopクラスタの提供
Hadoop クラスターの管理
Hadoop クラスターの監視
4. スパーク 高速かつ汎用的なクラスター コンピューティング システム。 Java、Scala、Python、R の高レベル API と、汎用実行グラフをサポートする最適化されたエンジンを提供します。大規模データ処理フレームワーク (企業における一般的な 3 つのデータ処理シナリオに対応可能: 複雑なバッチ データ処理、履歴データに基づくインタラクティブ クエリ、リアルタイム データ ストリームに基づくデータ処理、Ceph: Linux 分散ファイル システム)。 5. 嵐 Storm は、無料、オープン ソース、分散型、高度なフォールト トレランスを備えたリアルタイム コンピューティング システムです。 Storm は継続的なストリーム コンピューティングを容易にし、Hadoop バッチ処理では満たせないリアルタイム要件を補います。 Storm は、リアルタイム分析、オンライン機械学習、継続的なコンピューティング、分散リモート呼び出し、ETL でよく使用されます。 Storm の導入と管理は非常にシンプルで、同様のストリーミング コンピューティング ツールの中でもパフォーマンスが抜群です。 |
<<: 質問しながら分散システムのデータシャーディングを学ぶ
>>: アリババクラウド、重慶市の「アジアで最もスマートな大都市」建設を支援
ウェブサイトの最適化には多くの詳細事項が関係していることは誰もが知っています。これらの細かい詳細は、...
残り物をいくつか再掲します。今はもうなくなってしまった winity.io VPS ブランドをもう一...
[51CTO.com からのオリジナル記事] 25 年前、インターネットが人々の生活に入り込みました...
ご存知のとおり、B2C ウェブサイトは、フォーラムや情報ウェブサイトのように人気を集めて広告を販売し...
raksmartはどうですか? raksmart 韓国 VPS はどうですか?韓国本土の最適化はどう...
近年、デジタルトランスフォーメーションの進展に伴い、企業はビジネスをクラウドに移行し始めています。 ...
最近、 Pinduoduo の2 つの大きなイベントが大きな注目を集めています。一つは、11月20日...
過去1、2年で購買量市場は爆発的に拡大し、今年に入って急速に競争の激しい市場に突入しました。購買量で...
SEO 効率を向上させるために、Web サイトのパスワード情報を大量に記憶する方法。大量のウェブサイ...
当時の Linux オペレーティング システムと同様に、OpenStack の評判は一夜にして IT...
サーチャーにとって、サーバーの IIS ログは最適化の参照ログとして非常に重要であり、ここから検索エ...
クラウド ネイティブ テクノロジーは、企業がより迅速かつ効率的にソフトウェアを配信できるように支援で...
tinyvzは128MメモリのVZを専門に販売しているramhostのブランドです。 tinykvm...
今日、初心者向けの QQ グループでチャットしていたところ、ウェブマスター ツールの使用に関して多く...
[51CTO.com からのオリジナル記事] 2つのセッションが終了し、デジタル構築と開発について熱...