1. ハドゥープ Hadoop は、シンプルなプログラミング モデルを使用して、コンピューターのクラスター全体の分散環境でビッグ データを保存および処理できるオープン ソース フレームワークです。単一のサーバーから数千台のマシンまで拡張できるように設計されており、各マシンはローカル コンピューティングとストレージを提供できます。 2. ドルイド Druid は、リアルタイム データ分析ストレージ システムであり、Java 言語で最高のデータベース接続プールです。 Druid は強力な監視および拡張機能を提供できます。 Druid は、分散型の列指向のリアルタイム分析データ リポジトリであり、マルチテナント環境での探索ダッシュボードを強化するためによく使用されます。 データ ウェアハウス ソリューションとして、Druid はペタバイト規模のデータ セットに対する高速な集約クエリに優れています。 Druid は、さまざまな柔軟なフィルター、正確な計算、近似アルゴリズム、その他の便利な計算をサポートしています。 Druid はストリーミング データとバッチ データの両方をロードでき、Samza、Kafka、Storm、Spark、Hadoop と統合します。 3. アンバリ ビッグデータプラットフォーム構築・監視ツール。 CDHに類似 Ambari は次のことが可能です。 Hadoopクラスタの提供
Hadoop クラスターの管理
Hadoop クラスターの監視
4. スパーク 高速かつ汎用的なクラスター コンピューティング システム。 Java、Scala、Python、R の高レベル API と、汎用実行グラフをサポートする最適化されたエンジンを提供します。大規模データ処理フレームワーク (企業における一般的な 3 つのデータ処理シナリオに対応可能: 複雑なバッチ データ処理、履歴データに基づくインタラクティブ クエリ、リアルタイム データ ストリームに基づくデータ処理、Ceph: Linux 分散ファイル システム)。 5. 嵐 Storm は、無料、オープン ソース、分散型、高度なフォールト トレランスを備えたリアルタイム コンピューティング システムです。 Storm は継続的なストリーム コンピューティングを容易にし、Hadoop バッチ処理では満たせないリアルタイム要件を補います。 Storm は、リアルタイム分析、オンライン機械学習、継続的なコンピューティング、分散リモート呼び出し、ETL でよく使用されます。 Storm の導入と管理は非常にシンプルで、同様のストリーミング コンピューティング ツールの中でもパフォーマンスが抜群です。 |
<<: 質問しながら分散システムのデータシャーディングを学ぶ
>>: アリババクラウド、重慶市の「アジアで最もスマートな大都市」建設を支援
国内の業者「Fanyun」のロサンゼルスVPSには、cn2ネットワーク、拡張可能なクラウドディスク、...
Baidu は新たな変更を加えました。検索結果を収集、共有、報告できるようになりました。これは LE...
昨年第4四半期に黒字を達成したヴァンクルにとって、今年のプレッシャーは依然として非常に大きい。チュー...
ラップ「Unspeakable」のノードをチェックしてみましたが、情報を見つけることができませんでし...
6月22日の早朝、多くのウェブマスターがサイトのKステーションと重量の低下、またはホームページのスナ...
cmivps は今年、大規模なブラックフライデー プロモーションを実施しました。香港のデータ センタ...
外部リンクが王様で、内部リンクが最も重要だと言われています。では、ウェブサイトで内部リンクをうまく活...
[51CTO.com クイック翻訳] Web スケールのアプリケーションでは、優れたユーザー エクス...
サイト全体の最適化とはSEO 最適化は、ウェブサイト最適化とも呼ばれ、検索エンジンのランキング ルー...
新しい MongoDB Atlas マルチクラウド クラスター機能は火曜日に一般提供が開始され、同社...
私は外部リンクの掲載にかなりの経験があります。外部リンクはウェブサイトの最適化に非常に良い効果をもた...
1. 動画サイトでの資金の浪費のプレッシャーは緩和が難しい:広告時間を静かに倍増6月12日早朝のニュ...
2019年、モバイルインターネットユーザー数は10億人を突破しました。トラフィック配当がピークを迎え...
2002年に設立されたアメリカの有名なデータセンターであるHivelocityは、特別なブラックフラ...
360とBaiduの間の「3B戦争」はようやく沈静化したが、現在再燃の兆しを見せている。 1月5日、...