Hadoop 擬似分散セットアップ操作手順ガイド

Hadoop 擬似分散セットアップ操作手順ガイド

[[207661]]

1. 準備

  • /opt/ディレクトリにモジュールとソフトウェアのフォルダを作成します。
    • 操作権限を変更する(ルートユーザーに切り替える)
  1. chown -R wxt:wxt /opt/
  • その後、通常のユーザーに切り替える
  1. mkdir ソフトウェア
  2.  
  3. mkdir モジュール
  • lrzsz をインストールします (Linux でのアップロードとダウンロードに ftp を置き換えることができます)。

まずlrzszをインストールします

  1. yum -y インストール lrzsz
  • ファイルをアップロードし、rz コマンドを実行します。ファイル選択ウィンドウがポップアップ表示されます。ファイルを選択し、「OK」をクリックします。
  1. rz
  • ファイルをダウンロードし、szコマンドを実行します。
  1. サイズ

2. Hadoop環境の展開 - JDK部分

1.

  • ソフトウェアにjdkをアップロードする

2.

  • jdkをモジュールに解凍する
    • tar -zxvf jdk-7u67-linux-x64.tar.gz -C /opt/modules/

3.

  • 環境変数を変更する
    • ルートユーザーに切り替えて、vi /etc/profile ファイルを変更し、jdk 環境変数を設定します。
  1. #JAVA_HOME
  2. JAVA_HOME=/opt/modules/jdk1.7.0_67 をエクスポートします。
  3. エクスポート PATH=$PATH:$JAVA_HOME/bin

4.

  • /etc/profile をソースにしてファイルを有効にします
  • 構成が成功したことを確認する
    • java バージョン
  1. Java バージョン"1.7.0_09-icedtea"  
  2. OpenJDK ランタイム環境 (rhel-2.3.4.1.el6_3-x86_64)
  3. OpenJDK 64ビットサーバー VM (ビルド 23.2-b09、混合モード)
  • jpsコマンドはJavaプロセスを表示できる
  • $JAVA_HOMEをエコーする

3. Hadoop擬似分散環境の展開 - Hadoop部分

1.

  • hadoop-2.5.0.tar.gzファイルをソフトウェアにアップロードします。
  • ファイルをモジュールに解凍する
    • tar -zxvf hadoop-2.5.0.tar.gz -C /opt/modules/

2.

  • ディスク領域を節約するために、Hadoop ディレクトリをクリーンアップし、hadoop/share/doc ディレクトリを削除します。このコマンドを使用してdf -hを表示します

3.

  • hadoop/etc/hadoop/hadoop-env.shファイルを変更する
  • hadoop/etc/hadoop/mapred-env.shファイルを変更する
  • hadoop/etc/hadoop/yarn-env.shファイルを変更する
  • Javaのインストールパスを指定する
    • JAVA_HOME=/opt/modules/jdk1.7.0_67 をエクスポートします。

4.

  • 知らせ:
    • Hadoopの4つのコアモジュールは、4つのデフォルト設定ファイルに対応しています。
    • HadoopのデフォルトのファイルシステムであるHDFSは、ファイルシステムのアクセスポイントです。
    • Namenodeでは、初期のHadoop 1.xではマシンポート9000が使用されていましたが、現在Hadoop 2.xでは、RPC通信メカニズムを使用して、ノード間の直接的な内部通信にポート8020を使用しています。

5.

  • hadoop/etc/hadoop/core-site.xmlファイルを変更する
  1. <プロパティ>
  2. <名前>fs.defaultFS</名前>
  3. <! --bigdata-4 は私のローカルホスト名です -->  
  4. <値>hdfs://bigdata-4:8020</値>
  5. </プロパティ>
  6. <プロパティ>
  7. <名前>hadoop.tmp.dir</名前>
  8. <値>/opt/modules/hadoop-2.5.0/data/tmp</値>
  9. </プロパティ>

6.

  • 知らせ:
    • /tmp は一時保存ディレクトリを表します。システムが再起動するたびに、システムは事前に設定されたスクリプトに従ってシステム内のファイルを削除し、システムによって生成されたファイル パスを再カスタマイズします。 /tmp がクリアされ、データ ファイルのセキュリティが保証されなくなります。

7.

  • hadoop/etc/hadoop/hdfs-site.xmlファイルを変更する
    • HDFS ファイル ストレージのコピー数を指定します。デフォルトは 3 です。ここでは、単一のマシンに対して 1 に設定されています。この数はデータノードの数よりも小さくなければなりません。
  1. <プロパティ>
  2. <名前>dfs.replication</名前>
  3. <値>1</値>
  4. </プロパティ>

8.

  • hadoop/etc/hadoop/slavesファイルを変更する
    • スレーブ ノードのマシンの場所を指定し、ホスト名を追加します。
  1. ビッグデータ-4

9.

  • フォーマット名ノード
  1. bin/hdfs ネームノード -フォーマット

10.

  • 起動コマンド
    • sbin/hadoop-daemon.sh ネームノードを起動します
    • sbin/hadoop-daemon.sh データノードを起動します

11.

  • HDFS外部UIインターフェースを表示する
    • bigdata-04 または IP アドレスの後にポート番号 50070、外部通信 http dfs.namenode.http-address 50070
    • http://bigdata-4:50070 (Windows 上でホストがローカルに設定されていない場合は、設定する必要があります)
    • ページが正しく開けない場合は、ファイアウォールがオフになっているかどうかを確認してください。
      • ルートユーザーに切り替え、サービスiptablesステータス
      • ファイアウォールをオフにする chkconfig iptables off

12.

  • HDFS環境のテスト
    • フォルダーを作成します。 HDFS には、Linux と同様に、ユーザー ホーム ディレクトリの概念があります。
    • bin/hdfs dfs -mkdir -p wxt_test/iuput

13.

  • HDFS にファイルをアップロードします (任意のファイルをアップロードするだけです)
    • bin/hdfs dfs -put /opt/modules/hadoop-2.5.0/etc/hadoop/core-site.xml wxt_test/input/core-site.xml
    • アップロードは成功し、アップロードされたファイルが HDFS 外部 UI インターフェイスに表示されます。

14.

  • HDFS ファイルの読み取り
    • bin/hdfs dfs -text /core-site.xml
    • アップロードされたファイルの内容がターミナルに表示されます。

15.

  • ファイルをローカル コンピューターにダウンロードします (ダウンロード先を指定し、名前を get-site.xml に変更します)。bin/hdfs dfs -get /core-site.xml /home/wxt/Desktop/get-site.xml すると、このファイルが表示され、デスクトップに名前が変更されます。

これでHadoopの擬似分散構築は完了です。

<<:  ディープラーニングの分散トレーニングにおける大きなバッチサイズと学習率の関係をどのように理解すればよいでしょうか?

>>:  クラウドベースのデータが現代のスタートアップを最適化

推薦する

orangewebsite: アイスランド サーバー、アイスランド VPS、アイスランド ホスティング

2006 年に設立された orangewebsite は、仮想ホスティング、VPS、専用サーバーを運...

UCloudとPingCAPが協力し、Cloud TiDBが正式に全世界でリリース

2017年10月、中国を代表する中立型クラウドコンピューティング企業であるUCloudは、国内のオー...

gcoreはどうですか? gcore 香港 VPS 評価データ共有

gcoreはどうですか? gcore香港はどうですか? gcore は、中国香港で香港 VPS、香港...

dogyun のロシア cn2 gia vps (静的クラシック クラウド サーバー) の簡単なレビュー

dogyun が提供するクラシック クラウド サーバーには、ロシアのデータ センターから選択でき、ロ...

Goで実装された分散トランザクションフレームワーク

[[439474]]この記事はWeChatの公開アカウント「RememberGo」から転載したもので...

クラウドコンピューティングを安全かつスムーズに利用する方法

企業はクラウド コンピューティングを導入して、継続的な構築、統合、展開、保護、監視、修復を通じて運用...

新年、あなたのブログはどのような新たな展開を迎えるでしょうか?

ブログはすでに繁栄したウェブサイトの形態であり、ウェブマスターの観点から見ても、ユーザーの観点から見...

アウトバウンドリンクを構築するための実践ガイド

私は a5 ウェブマスターの Web サイトに記事を送信しましたが、多くのウェブマスターが記事を収集...

主流の分散ストレージ技術の比較分析と応用についてお話ししましょう

[[323651]]分散ファイルシステム分散ファイル システム (DFS) とは、必ずしもローカル...

quickweb-VPS半額/商人がどんなに気取った人でも、市場のルールには耐えられない

quickweb は 2009 年に設立されたニュージーランドの VPS 企業 (正式に登録され、商...

vpsua: 高品質のウクライナ VPS、月額 6.92 ドルから、Windows、PayPal 対応

vps.ua はウクライナの商人で、2010 年に設立されました。主な事業は VPS (OpenVZ...

SEO データ分析: ユーザー直帰率調査

ウェブサイトの SEO を行う際には、最適化の方向性を示すデータが必要であり、直帰率は調査する必要が...

インターネットマーケティングを始める方法を教えます

今日のインターネット社会では、電子商取引であれ、伝統的な実店舗の経営者であれ、多くの人が本当のインタ...

中国政府はクラウドコンピューティングを外国投資に開放するか、外国企業が自由貿易地域に独自のIDCを構築することを許可する可能性がある。

ウォール・ストリート・ジャーナル紙が関係者の話として報じたところによると、中国は外国のテクノロジー企...

ウェブサイト運営の失敗の根本的な原因は方向性を見失うこと

インターネットの発展は、ウェブマスター業界の発展につながりました。あらゆる側面からの統計はウェブサイ...