1. はじめに HBase は分散型の列指向のオープンソース データベースです。一般的なリレーショナルデータベースとは異なり、非構造化データを保存するのに適したデータベースです。もう 1 つの違いは、HBase が行ベースではなく列ベースのモデルであることです。 HBase は BigTable とまったく同じデータ モデルを使用します。ユーザーはデータ行をテーブルに保存します。データ行にはオプションのキーと任意の数の列が含まれます。 1 つ以上の列が ColumnFamily を形成します。 Fmaily の下の列は HFile に配置されているため、データのキャッシュが容易になります。テーブルはスパース形式で保存されるため、ユーザーは行に対してさまざまな列を定義できます。 HBase では、データは主キーによってソートされ、テーブルは主キーに基づいて複数の領域に分割されます。 分散型の運用環境では、HBase は HDFS を基本的なストレージ ファシリティとして使用して HDFS 上で実行する必要があります。 HBase の上位層は、データにアクセスするための Java API 層を提供し、アプリケーションが HBase に保存されているデータにアクセスできるようにします。 HBase クラスターは、主にマスター、リージョン サーバー、Zookeeper で構成されます。具体的なモジュールは次の図に示されています。 HBase の関連モジュールの機能を簡単に紹介します。 マスター HBase マスターは、複数の RegionServer を調整し、各 RegionServer の状態を検出し、RegionServer 間の負荷を分散するために使用されます。 HBaseMaster には、Region を RegionServer に割り当てる役割もあります。 HBase では複数のマスターノードを共存させることができますが、そのためには Zookeeper の助けが必要です。ただし、複数のマスター ノードが共存する場合は、1 つのマスターのみがサービスを提供し、他のマスター ノードはスタンバイ状態になります。動作中のマスター ノードがダウンすると、他のマスター ノードが HBase クラスターを引き継ぎます。 リージョンサーバー RegionServer には複数のリージョンが含まれます。 RegionServer の役割は、テーブルを管理し、読み取りおよび書き込み操作を実装することだけです。クライアントは RegionServer に直接接続し、通信して HBase のデータを取得します。リージョンは、HBase データが実際に保存される場所であり、つまり、リージョンは HBase の可用性と配布の基本単位です。テーブルが大きく、複数の CF で構成されている場合、テーブル内のデータは複数のリージョンに保存され、各リージョンに複数のストレージ ユニット (ストア) が関連付けられます。 動物園の飼育員 HBase にとって、Zookeeper の役割は非常に重要です。まず、Zookeeper は HBase Master の HA ソリューションです。つまり、Zookeeper は少なくとも 1 つの HBase マスターが実行されていることを確認します。 Zookeeper はリージョンとリージョン サーバーの登録を担当します。実際、Zookeeper は分散型ビッグデータ フレームワークにおけるフォールト トレランスの標準フレームワークとなっています。 HBase だけでなく、分散型ビッグデータに関連するほぼすべてのオープンソース フレームワークは、HA を実現するために Zookeeper に依存しています。 HBase クラスターは Hadoop クラスターをベースに構築されるため、HBase クラスターを構築する前に Hadoop クラスターを構築し、両者の互換性を考慮する必要があります。 2. 環境整備 (1)各サーバーのホスト名を変更し、hostsファイルを追加し、ファイアウォールをオフにする
(2)c7001はクラスタを起動するためにsshパスワードフリーログインを設定する
(3)各サーバーはjdk1.7+で構成されている
3. hbaseをインストールする
設定ファイルを変更する
hbase-site.xml を編集し、構成ファイルを追加します。
Hbaseを他のマシンにコピーする
クラスターを起動する
ウェブアクセスIP:16010 各ノードのプロセス(画像は複製中) |
>>: IT の回復力と事業継続性を向上させる 3 つの方法
私がNetEase YanxuanのブランドディレクターであるKang Leに会ったのは2016年末...
justhost から良いニュースが届きました: (1) すべての VPS は、トラフィック制限なし...
webhostingbuzz は、仮想ホスト\VPS などの割引コードを公開しています: 割引コード...
v.ps は現在、米国にニューヨーク、シアトル、サンノゼの 3 つのデータセンターを持っています。z...
zji.net は最近、香港スーパーセット シリーズ製品である香港 VDS をリリースしました。デー...
1. ロシア・ウクライナ戦争のIT暴露2022 年のロシアとウクライナの戦争では、観客は興奮を、軍...
[[314260]] 2020 年代が正式に始まるにあたり、Oracle は将来のテクノロジーとエン...
2020年8月18日、Alibaba Cloudが主催する初のクラウドネイティブマイクロサービスカン...
greenwebpage は香港 VPS 事業を運営しています。サーバーは M247 コンピューター...
現在 lovevps が使用しているデータ センターは次のとおりです: - Custodian DC...
広告には千年近い歴史があります。今日、伝統的な広告は大きな変化を遂げています。伝統的な広告の形態は何...
vultr.com は 12 月に人気の割引コード、SSDVPS を提供しています。このコードを使用...
私の友人の Li Jian によると、彼は最近自分の個人記録をチェックしているが、そこには商業情報や...
これまで、日本、シンガポール、インドにある Linode のクラウド サーバーをレビューしてきました...
ヤフージャパンで働いている友人は、参考にできる経験が比較的少ないのですが、需要はかなり高いです。友人...