一般的な分散ファイルシステムの包括的なレビュー。ビッグデータを理解したいなら、ストレージから始めましょう

一般的な分散ファイルシステムの包括的なレビュー。ビッグデータを理解したいなら、ストレージから始めましょう

[[239139]]

ビッグデータの最初の層はストレージです。効率的にアクセスできる分散システムにデータを保存するだけで、作業効率を向上させることができます。エディターでは、次の一般的な分散ファイル システムについて説明します。

光沢

Lustre は非常に安全で大規模な分散ファイル システムです。これは最初に CFS (Cluster File System Inc.) によって開発され、最初のバージョンは 2003 年に CFS、HP、Intel によってリリースされました。今ではすっかり成熟しました。ストレージ容量は通常 PB から始まり、サポートされるノードの数は数万に達することがあります。ただし、装備には特別な要件があります。

ハードウェア

HDFS は、以前に紹介した Hadoop の組み込み分散ファイルシステムです。 HDFS の最大の利点は価格が安いため、広く利用されています。また、高い信頼性と高い耐障害性により、ユーザーからの信頼も非常に高まります。 HDFS のストレージ レベルは PB を超えていますが、小さなファイルが多すぎる状況には対応できません。

量子金融システム

QFS は、大量のデータを効率的に順次読み書きするという問題を解決するように設計されている点で HDFS に似ています。ただし、QFS はパフォーマンスの点で HDFS を上回り、読み取りと書き込みの効率が全体的に 60% 以上向上します。 QFS はまだ比較的ニッチな技術であり、広範囲にテストされていないため、大規模な本番環境では使用できません。

グラスターFS

GlusterFS も PB レベルのクラスター ファイル システムです。そのアイデアは、クラスター内のすべてのサーバーのストレージスペースを大規模なネットワーク システムに集約することです。このアプローチの最大の特徴は、分散化されており、単一障害点がないことです。

アルクシオ

Alluxio はメモリベースの分散ファイルシステムとしては初となるため、その応答速度は通常の分散ファイルシステムを大幅に上回ります。たとえば、HDFS はそれよりも数百倍遅くなります。 Alluxio と Spark も良好な相互作用があります。最も重要なことは、Alluxio は中国人によって開発されており、ドキュメントはすべて中国語であることです。これは、長い間英語のドキュメントに悩まされてきた人にとっては間違いなく朗報です。

一般的な分散ファイルシステムの包括的なレビュー。ビッグデータを理解したいなら、ストレージから始めましょう

セフ

Ceph は、単一障害点のない分散ファイルシステムでもあります。各 Ceph ノードには、ノードのデータ情報を計算するために使用される少量のリソースがあり、それによって優れた負荷分散が実現されます。

PVFS

PVFS は、rm、dd、cat などの Linux のネイティブ コマンドとツールを適切にサポートできる並列仮想ファイル システムです。ただし、PSFS には単一の管理ノードがあるため、単一障害点があり、起動後に柔軟に変更することはできません。

<<:  自律性、未来へのさらなる価値の創造

>>:  ブロックチェーン分散ストレージデータのトップ10トレンド

推薦する

ユーザーを怒らせる 7 つのウェブサイト ユーザー エクスペリエンス: なぜ禁止できないのか

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています多くのウェ...

Baiduの経験から、検索の重みが高いのはSEO内部ページの最適化によるものだとわかる。

Baidu のウェイトプロモーションを行ったことがある友人は皆、Baidu で内部リンクと外部リンク...

企業ウェブサイトの構築と保守:プロフェッショナルなサービスチームが鍵

インターネットの発展に伴い、多くの企業が自社のコーポレートサイトを開設しており、ほとんどの企業が自社...

2018 年の中国企業におけるクラウド コンピューティング アプリケーションの現状とニーズ

近年、デジタル変革の波を受けて、わが国のクラウドコンピューティングの発展は、爆発的な需要の時代を迎え...

おすすめ: WattaServer - 超格安サーバー/11 台のコンピュータ ルーム/35 ドルから (L5420)

Host Cat は、卸売インターネットよりも価格性能比に優れたサーバー業者 WattaServer...

歯科医がパートタイムのウェブマスターになるまでの道のり - 傲慢な自信から自分自身を明確に理解するまで

はじめに: この記事を以前から書きたいと思っていましたが、なかなか書けませんでした。今日、決心して書...

苦労しているウェブマスターは SEO の考え方を理解しているでしょうか?

インターネットの発展に伴い、SEO の人材を必要とする業界はますます増えています。企業が多額の費用を...

Baidu の経験を活用してロングテールキーワードランキングを素早く獲得する方法について簡単に説明します。

Baidu Experience は開発以来、多くの SEO 担当者が外部リンクを公開するための優れ...

Hadoop 完全分散型クラスタ

まず、3つのクライアント(hadoop102、hadoop103、hadoop104)を準備し、ファ...

dogyun:香港サーバーが直接100元引き下げ、翌月は無料、2ヶ月500元、e3-1235/16gDDR4/2T NVMe/40M帯域幅無制限トラフィック

Dogyunの香港データセンターは最近、香港の物理サーバーを大量に追加し、これに合わせてプロモーショ...

最適化中にキーワードを選択する方法

SEO最適化のプロセスにおいて、キーワードの選択は非常に重要なステップであり、SEOをうまく行うため...

Netty を使用して高性能な分散サービス フレームワークを作成する方法は?

[[407305]] 1. Nettyとは何ですか?それは何ができるのでしょうか? Netty は、...

その背後にある力 - Huayun Data は QR コード決済をより安全かつ便利にします

世界の金融業界もまた、新たな技術・産業の変化の波を迎えており、クラウドコンピューティング、ビッグデー...

百度でアリペイを検索すると文字化け、1つのウェブサイトに2つの検索結果が表示される

今日、Baiduを使用して特定のキーワードを検索し、同じウェブサイト上の他のキーワードと比較したとこ...

ウェブマスターのソフト記事のアイデアの源泉についての簡単な説明(パート 2)

数日前、私は皆さんと「ウェブマスターのソフト記事のアイデアの源泉についての簡単な議論(パート 1)」...