Hadoop 擬似分散セットアップ操作手順ガイド

Hadoop 擬似分散セットアップ操作手順ガイド

[[207661]]

1. 準備

  • /opt/ディレクトリにモジュールとソフトウェアのフォルダを作成します。
    • 操作権限を変更する(ルートユーザーに切り替える)
  1. chown -R wxt:wxt /opt/
  • その後、通常のユーザーに切り替える
  1. mkdir ソフトウェア
  2.  
  3. mkdir モジュール
  • lrzsz をインストールします (Linux でのアップロードとダウンロードに ftp を置き換えることができます)。

まずlrzszをインストールします

  1. yum -y インストール lrzsz
  • ファイルをアップロードし、rz コマンドを実行します。ファイル選択ウィンドウがポップアップ表示されます。ファイルを選択し、「OK」をクリックします。
  1. rz
  • ファイルをダウンロードし、szコマンドを実行します。
  1. サイズ

2. Hadoop環境の展開 - JDK部分

1.

  • ソフトウェアにjdkをアップロードする

2.

  • jdkをモジュールに解凍する
    • tar -zxvf jdk-7u67-linux-x64.tar.gz -C /opt/modules/

3.

  • 環境変数を変更する
    • ルートユーザーに切り替えて、vi /etc/profile ファイルを変更し、jdk 環境変数を設定します。
  1. #JAVA_HOME
  2. JAVA_HOME=/opt/modules/jdk1.7.0_67 をエクスポートします。
  3. エクスポート PATH=$PATH:$JAVA_HOME/bin

4.

  • /etc/profile をソースにしてファイルを有効にします
  • 構成が成功したことを確認する
    • java バージョン
  1. Java バージョン"1.7.0_09-icedtea"  
  2. OpenJDK ランタイム環境 (rhel-2.3.4.1.el6_3-x86_64)
  3. OpenJDK 64ビットサーバー VM (ビルド 23.2-b09、混合モード)
  • jpsコマンドはJavaプロセスを表示できる
  • $JAVA_HOMEをエコーする

3. Hadoop擬似分散環境の展開 - Hadoop部分

1.

  • hadoop-2.5.0.tar.gzファイルをソフトウェアにアップロードします。
  • ファイルをモジュールに解凍する
    • tar -zxvf hadoop-2.5.0.tar.gz -C /opt/modules/

2.

  • ディスク領域を節約するために、Hadoop ディレクトリをクリーンアップし、hadoop/share/doc ディレクトリを削除します。このコマンドを使用してdf -hを表示します

3.

  • hadoop/etc/hadoop/hadoop-env.shファイルを変更する
  • hadoop/etc/hadoop/mapred-env.shファイルを変更する
  • hadoop/etc/hadoop/yarn-env.shファイルを変更する
  • Javaのインストールパスを指定する
    • JAVA_HOME=/opt/modules/jdk1.7.0_67 をエクスポートします。

4.

  • 知らせ:
    • Hadoopの4つのコアモジュールは、4つのデフォルト設定ファイルに対応しています。
    • HadoopのデフォルトのファイルシステムであるHDFSは、ファイルシステムのアクセスポイントです。
    • Namenodeでは、初期のHadoop 1.xではマシンポート9000が使用されていましたが、現在Hadoop 2.xでは、RPC通信メカニズムを使用して、ノード間の直接的な内部通信にポート8020を使用しています。

5.

  • hadoop/etc/hadoop/core-site.xmlファイルを変更する
  1. <プロパティ>
  2. <名前>fs.defaultFS</名前>
  3. <! --bigdata-4 は私のローカルホスト名です -->  
  4. <値>hdfs://bigdata-4:8020</値>
  5. </プロパティ>
  6. <プロパティ>
  7. <名前>hadoop.tmp.dir</名前>
  8. <値>/opt/modules/hadoop-2.5.0/data/tmp</値>
  9. </プロパティ>

6.

  • 知らせ:
    • /tmp は一時保存ディレクトリを表します。システムが再起動するたびに、システムは事前に設定されたスクリプトに従ってシステム内のファイルを削除し、システムによって生成されたファイル パスを再カスタマイズします。 /tmp がクリアされ、データ ファイルのセキュリティが保証されなくなります。

7.

  • hadoop/etc/hadoop/hdfs-site.xmlファイルを変更する
    • HDFS ファイル ストレージのコピー数を指定します。デフォルトは 3 です。ここでは、単一のマシンに対して 1 に設定されています。この数はデータノードの数よりも小さくなければなりません。
  1. <プロパティ>
  2. <名前>dfs.replication</名前>
  3. <値>1</値>
  4. </プロパティ>

8.

  • hadoop/etc/hadoop/slavesファイルを変更する
    • スレーブ ノードのマシンの場所を指定し、ホスト名を追加します。
  1. ビッグデータ-4

9.

  • フォーマット名ノード
  1. bin/hdfs ネームノード -フォーマット

10.

  • 起動コマンド
    • sbin/hadoop-daemon.sh ネームノードを起動します
    • sbin/hadoop-daemon.sh データノードを起動します

11.

  • HDFS外部UIインターフェースを表示する
    • bigdata-04 または IP アドレスの後にポート番号 50070、外部通信 http dfs.namenode.http-address 50070
    • http://bigdata-4:50070 (Windows 上でホストがローカルに設定されていない場合は、設定する必要があります)
    • ページが正しく開けない場合は、ファイアウォールがオフになっているかどうかを確認してください。
      • ルートユーザーに切り替え、サービスiptablesステータス
      • ファイアウォールをオフにする chkconfig iptables off

12.

  • HDFS環境のテスト
    • フォルダーを作成します。 HDFS には、Linux と同様に、ユーザー ホーム ディレクトリの概念があります。
    • bin/hdfs dfs -mkdir -p wxt_test/iuput

13.

  • HDFS にファイルをアップロードします (任意のファイルをアップロードするだけです)
    • bin/hdfs dfs -put /opt/modules/hadoop-2.5.0/etc/hadoop/core-site.xml wxt_test/input/core-site.xml
    • アップロードは成功し、アップロードされたファイルが HDFS 外部 UI インターフェイスに表示されます。

14.

  • HDFS ファイルの読み取り
    • bin/hdfs dfs -text /core-site.xml
    • アップロードされたファイルの内容がターミナルに表示されます。

15.

  • ファイルをローカル コンピューターにダウンロードします (ダウンロード先を指定し、名前を get-site.xml に変更します)。bin/hdfs dfs -get /core-site.xml /home/wxt/Desktop/get-site.xml すると、このファイルが表示され、デスクトップに名前が変更されます。

これでHadoopの擬似分散構築は完了です。

<<:  ディープラーニングの分散トレーニングにおける大きなバッチサイズと学習率の関係をどのように理解すればよいでしょうか?

>>:  クラウドベースのデータが現代のスタートアップを最適化

推薦する

バラの香り:SEO最適化の最小単位は1ページです

私たちは常にウェブサイトの SEO に関するいくつかの理論を重視し、ウェブサイトのランキングを向上さ...

エンタープライズ Web サイトの最適化の焦点は何ですか?

インターネット企業で働く SEO 担当者のほとんどは、企業のウェブサイト最適化からキャリアをスタート...

オラクルは好調な業績を報告したが、投資家はクラウドの成長を懸念し続けている

データベースおよびビジネスソフトウェア大手のオラクルが予想を上回る四半期業績と見通しを発表したにもか...

CIO が検討すべきクラウド移行のヒント 10 選

現在、企業の IT リーダーはさまざまなメリットを求めてクラウドに移行していますが、調査によると、ク...

ウェブマスターになることについてお話ししましょう。

インターネットに触れるようになってから1年が経ちました。少し前、私は難しい決断を下し、いくつかの国営...

外部リンクをより効果的にするために、5つの外部リンクの側面をうまく活用しましょう

ウェブサイトの外部リンクを構築する方法については、インターネット上の SEO 記事ですでに詳しく説明...

ウェブマスターは、どうすれば自分のウェブサイトの「ランキングが低い」状態を解消できるでしょうか?

SEO についてもっと学びたかったので、多くの SEO 学習グループに参加しました。グループでは、ほ...

エッジコンピューティングを加速させる10のトレンド

[[347333]]技術の進歩と市場の発展に伴い、エッジ コンピューティングに投資する企業が増えてい...

Baidu の新規サイト登録時間が遅くなる問題への対処方法

7月初旬の百度緑大根アルゴリズム2.0のアップデートで、百度はソフトな記事を掲載するニュースサイトを...

キーワード選択手順を分析する

この記事では主にインターネット上でキーワードを選択する手順について説明します。ウェブサイトやウェブペ...

現在の SEO、路地に入ってしまったのでしょうか?

現在の SEO の道は少し迷っているようで、人々はとらえどころがないと感じています。たとえば、検索エ...

平安クラウドの「魔法の武器」は企業のR&Dライフサイクル全体を完全に保護します

[51CTO.comからのオリジナル記事] デジタルトランスフォーメーションが加速するにつれ、ビジネ...

AR 広告の本質はゲームカーニバルですか?

昨年、アリペイが実施した「五福」キャンペーンは大好評でした。5年前、グーグルはプロジェクト・グラスを...

LVSが提供する3つのIP負荷分散技術

1. LVSと負荷分散の概要: LVS はLinux Virtual Serverの略で、 Linu...

張亜琴:5年後には企業はインターネットなしでは生き残れないだろう

2009年4月17日から19日まで、「ボアオ・アジアフォーラム2009年次会議」が開催されました。今...