1. ハドゥープ Hadoop は、シンプルなプログラミング モデルを使用して、コンピューターのクラスター全体の分散環境でビッグ データを保存および処理できるオープン ソース フレームワークです。単一のサーバーから数千台のマシンまで拡張できるように設計されており、各マシンはローカル コンピューティングとストレージを提供できます。 2. ドルイド Druid は、リアルタイム データ分析ストレージ システムであり、Java 言語で最高のデータベース接続プールです。 Druid は強力な監視および拡張機能を提供できます。 Druid は、分散型の列指向のリアルタイム分析データ リポジトリであり、マルチテナント環境での探索ダッシュボードを強化するためによく使用されます。 データ ウェアハウス ソリューションとして、Druid はペタバイト規模のデータ セットに対する高速な集約クエリに優れています。 Druid は、さまざまな柔軟なフィルター、正確な計算、近似アルゴリズム、その他の便利な計算をサポートしています。 Druid はストリーミング データとバッチ データの両方をロードでき、Samza、Kafka、Storm、Spark、Hadoop と統合します。 3. アンバリ ビッグデータプラットフォーム構築・監視ツール。 CDHに類似 Ambari は次のことが可能です。 Hadoopクラスタの提供
Hadoop クラスターの管理
Hadoop クラスターの監視
4. スパーク 高速かつ汎用的なクラスター コンピューティング システム。 Java、Scala、Python、R の高レベル API と、汎用実行グラフをサポートする最適化されたエンジンを提供します。大規模データ処理フレームワーク (企業における一般的な 3 つのデータ処理シナリオに対応可能: 複雑なバッチ データ処理、履歴データに基づくインタラクティブ クエリ、リアルタイム データ ストリームに基づくデータ処理、Ceph: Linux 分散ファイル システム)。 5. 嵐 Storm は、無料、オープン ソース、分散型、高度なフォールト トレランスを備えたリアルタイム コンピューティング システムです。 Storm は継続的なストリーム コンピューティングを容易にし、Hadoop バッチ処理では満たせないリアルタイム要件を補います。 Storm は、リアルタイム分析、オンライン機械学習、継続的なコンピューティング、分散リモート呼び出し、ETL でよく使用されます。 Storm の導入と管理は非常にシンプルで、同様のストリーミング コンピューティング ツールの中でもパフォーマンスが抜群です。 |
<<: 質問しながら分散システムのデータシャーディングを学ぶ
>>: アリババクラウド、重慶市の「アジアで最もスマートな大都市」建設を支援
ecovm は設立されてまだ日が浅い VPS ビジネスです。しかし、iwebserver.ca (1...
2008年に設立されたエストニアのホスティングプロバイダー、estnocの特別紹介。主にVPS、サー...
北京、6月12日(記者張鶴)記者が国家版権局から得た情報によると、国家版権局、中国サイバースペース管...
ロシアのサーバーは著作権などの管理が緩い場合が多く、特にロシアはヨーロッパとの接続に効果的なので、対...
SEO に直面すると、多くの人が戸惑います。始め方がわからない人、理解できないと思う人、一生懸命努力...
簡単に言えば、ウェブサイト編集者とは、関連する専門知識と、コンピュータやインターネットなどの最新の情...
クラウドコンピューティングは最近かなり話題になっています。 8月5日、Frontier CNCという...
最近、工業情報化部と中央サイバースペース安全情報化委員会弁公室は、「ブロックチェーン技術の応用と産業...
クラウド自動化とは、テクノロジーを使用してクラウド コンピューティング環境でアプリケーションとインフ...
最近、クラウド コンピューティングに注目が集まっており、ストレージは基盤となるプラットフォームとして...
Buyvm の仮想ホストがリリースされてから 1 か月以上経ちました。私はおそらくこれを購入した最初...
この記事では、Qunar.com が Mesos と Docker を使用してプライベート クラウド...
この経済社会において、文学ウェブサイトは結局のところビジネスであり、文学ウェブサイトを運営する最終的...
[[357046]]序文「三国殺し」は、中国の三国時代を背景に、身分を手がかりにトランプを形にした...
教育は人々の生活にとって最も重要なプロジェクトであり、「スマートシティ」の中核となる要素です。スマー...