Hadoop 擬似分散セットアップ操作手順ガイド

Hadoop 擬似分散セットアップ操作手順ガイド

[[207661]]

1. 準備

  • /opt/ディレクトリにモジュールとソフトウェアのフォルダを作成します。
    • 操作権限を変更する(ルートユーザーに切り替える)
  1. chown -R wxt:wxt /opt/
  • その後、通常のユーザーに切り替える
  1. mkdir ソフトウェア
  2.  
  3. mkdir モジュール
  • lrzsz をインストールします (Linux でのアップロードとダウンロードに ftp を置き換えることができます)。

まずlrzszをインストールします

  1. yum -y インストール lrzsz
  • ファイルをアップロードし、rz コマンドを実行します。ファイル選択ウィンドウがポップアップ表示されます。ファイルを選択し、「OK」をクリックします。
  1. rz
  • ファイルをダウンロードし、szコマンドを実行します。
  1. サイズ

2. Hadoop環境の展開 - JDK部分

1.

  • ソフトウェアにjdkをアップロードする

2.

  • jdkをモジュールに解凍する
    • tar -zxvf jdk-7u67-linux-x64.tar.gz -C /opt/modules/

3.

  • 環境変数を変更する
    • ルートユーザーに切り替えて、vi /etc/profile ファイルを変更し、jdk 環境変数を設定します。
  1. #JAVA_HOME
  2. JAVA_HOME=/opt/modules/jdk1.7.0_67 をエクスポートします。
  3. エクスポート PATH=$PATH:$JAVA_HOME/bin

4.

  • /etc/profile をソースにしてファイルを有効にします
  • 構成が成功したことを確認する
    • java バージョン
  1. Java バージョン"1.7.0_09-icedtea"  
  2. OpenJDK ランタイム環境 (rhel-2.3.4.1.el6_3-x86_64)
  3. OpenJDK 64ビットサーバー VM (ビルド 23.2-b09、混合モード)
  • jpsコマンドはJavaプロセスを表示できる
  • $JAVA_HOMEをエコーする

3. Hadoop擬似分散環境の展開 - Hadoop部分

1.

  • hadoop-2.5.0.tar.gzファイルをソフトウェアにアップロードします。
  • ファイルをモジュールに解凍する
    • tar -zxvf hadoop-2.5.0.tar.gz -C /opt/modules/

2.

  • ディスク領域を節約するために、Hadoop ディレクトリをクリーンアップし、hadoop/share/doc ディレクトリを削除します。このコマンドを使用してdf -hを表示します

3.

  • hadoop/etc/hadoop/hadoop-env.shファイルを変更する
  • hadoop/etc/hadoop/mapred-env.shファイルを変更する
  • hadoop/etc/hadoop/yarn-env.shファイルを変更する
  • Javaのインストールパスを指定する
    • JAVA_HOME=/opt/modules/jdk1.7.0_67 をエクスポートします。

4.

  • 知らせ:
    • Hadoopの4つのコアモジュールは、4つのデフォルト設定ファイルに対応しています。
    • HadoopのデフォルトのファイルシステムであるHDFSは、ファイルシステムのアクセスポイントです。
    • Namenodeでは、初期のHadoop 1.xではマシンポート9000が使用されていましたが、現在Hadoop 2.xでは、RPC通信メカニズムを使用して、ノード間の直接的な内部通信にポート8020を使用しています。

5.

  • hadoop/etc/hadoop/core-site.xmlファイルを変更する
  1. <プロパティ>
  2. <名前>fs.defaultFS</名前>
  3. <! --bigdata-4 は私のローカルホスト名です -->  
  4. <値>hdfs://bigdata-4:8020</値>
  5. </プロパティ>
  6. <プロパティ>
  7. <名前>hadoop.tmp.dir</名前>
  8. <値>/opt/modules/hadoop-2.5.0/data/tmp</値>
  9. </プロパティ>

6.

  • 知らせ:
    • /tmp は一時保存ディレクトリを表します。システムが再起動するたびに、システムは事前に設定されたスクリプトに従ってシステム内のファイルを削除し、システムによって生成されたファイル パスを再カスタマイズします。 /tmp がクリアされ、データ ファイルのセキュリティが保証されなくなります。

7.

  • hadoop/etc/hadoop/hdfs-site.xmlファイルを変更する
    • HDFS ファイル ストレージのコピー数を指定します。デフォルトは 3 です。ここでは、単一のマシンに対して 1 に設定されています。この数はデータノードの数よりも小さくなければなりません。
  1. <プロパティ>
  2. <名前>dfs.replication</名前>
  3. <値>1</値>
  4. </プロパティ>

8.

  • hadoop/etc/hadoop/slavesファイルを変更する
    • スレーブ ノードのマシンの場所を指定し、ホスト名を追加します。
  1. ビッグデータ-4

9.

  • フォーマット名ノード
  1. bin/hdfs ネームノード -フォーマット

10.

  • 起動コマンド
    • sbin/hadoop-daemon.sh ネームノードを起動します
    • sbin/hadoop-daemon.sh データノードを起動します

11.

  • HDFS外部UIインターフェースを表示する
    • bigdata-04 または IP アドレスの後にポート番号 50070、外部通信 http dfs.namenode.http-address 50070
    • http://bigdata-4:50070 (Windows 上でホストがローカルに設定されていない場合は、設定する必要があります)
    • ページが正しく開けない場合は、ファイアウォールがオフになっているかどうかを確認してください。
      • ルートユーザーに切り替え、サービスiptablesステータス
      • ファイアウォールをオフにする chkconfig iptables off

12.

  • HDFS環境のテスト
    • フォルダーを作成します。 HDFS には、Linux と同様に、ユーザー ホーム ディレクトリの概念があります。
    • bin/hdfs dfs -mkdir -p wxt_test/iuput

13.

  • HDFS にファイルをアップロードします (任意のファイルをアップロードするだけです)
    • bin/hdfs dfs -put /opt/modules/hadoop-2.5.0/etc/hadoop/core-site.xml wxt_test/input/core-site.xml
    • アップロードは成功し、アップロードされたファイルが HDFS 外部 UI インターフェイスに表示されます。

14.

  • HDFS ファイルの読み取り
    • bin/hdfs dfs -text /core-site.xml
    • アップロードされたファイルの内容がターミナルに表示されます。

15.

  • ファイルをローカル コンピューターにダウンロードします (ダウンロード先を指定し、名前を get-site.xml に変更します)。bin/hdfs dfs -get /core-site.xml /home/wxt/Desktop/get-site.xml すると、このファイルが表示され、デスクトップに名前が変更されます。

これでHadoopの擬似分散構築は完了です。

<<:  ディープラーニングの分散トレーニングにおける大きなバッチサイズと学習率の関係をどのように理解すればよいでしょうか?

>>:  クラウドベースのデータが現代のスタートアップを最適化

推薦する

Apple iPhone 6の失敗はイノベーションの欠如によるものではない

これまで、Appleが新しい主力製品を発表するたびに、業界の注目を集め、注目を集めてきました。しかし...

IaaS により Fed のクラウド支出が 25% 増加

クラウド コンピューティングに対する連邦政府の支出は、サービスとしてのインフラストラクチャ (Iaa...

Nutanix、2019年のエンタープライズクラウドインデックスレポートを発表、企業のハイブリッドクラウドへの移行を支援するために協力

ハイパーコンバージェンスからスタートし、中国市場にハイパーコンバージェンスを成功裏に導入したNuta...

ウェブサイトのURL標準化がSEOに及ぼす影響について

サイト全体の最適化については、あまり多くを語る必要はありません。製品マーケティングにおけるその重要性...

SEO の将来はどこまで続くのでしょうか?

中国では、特に2006年頃にSEOが非常に流行しました。この時期に、数え切れないほどの草の根ウェブマ...

インクルージョンはウェブマスターにとって問題になっていますか?

最近、パソコンの電源を入れて最初にやることは、データの変更を確認することではなく、ウェブサイトを開い...

hostcram: $15/年 - $25/2年、ダラス VPS、1G メモリ/1 コア (Ryzen9 5950X)/10g NVMe/1T トラフィック

Hostcram は当サイトに一度登場したことがあります。同社は 2009 年に設立され (こちらを...

認知キーワードはウェブサイトを新たな高みへ導く

キーワードの問題については、インターネット上に何千もの意見があるはずです。おそらく、私は今日もここで...

百度、外部リンクの価値を証明する外部リンクツールをリリース

ウェブマスターのウェブサイトでは、外部リンクの重要性はますます低下しており、将来的には効果がなくなる...

クラウド移行に向けてビジネスを準備する8つの方法

ビジネスをオンプレミスの施設からクラウド プラットフォームに移行するには、十分な準備を整えるために多...

gigsgigscloud: 11.11、ロサンゼルス CN2 GIA + 香港 3 ネットワーク直接接続、四半期あたり 10 ドルから

gigsgigscloud の 11.11 VPS プロモーションの特典: (1) ロサンゼルスの ...

Windows パフォーマンス モニターの使用に関するヒント

Windows パフォーマンス モニターは、Windows に付属するパフォーマンス監視ソフトウェア...

100日間インターネットマーケティングを続けることはできますか?

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っていますインターネ...

Hu Peibin: SEO 基本ガイド: 説明文の書き方に関する注意点

1. すべてのページに説明が必要なわけではなく、重要なページにのみ説明が必要です。説明はできる限りシ...

alpharacks、VPS 年額 4 ドルからの支払い、x-tool、ロサンゼルス データ センター

Alpharacks から、特別年間 KVM VPS の最新バージョンと openvz ベースの安価...