欧美亚洲中文,在线国自产视频,欧洲一区在线观看视频,亚洲综合中文字幕在线观看

      1. <dfn id="rfwes"></dfn>
          <object id="rfwes"></object>
        1. 站長資訊網(wǎng)
          最全最豐富的資訊網(wǎng)站

          linux怎么安裝hadoop

          linux安裝hadoop的方法:1、安裝ssh服務(wù);2、使用ssh進行無密碼驗證登錄;3、下載Hadoop安裝包;4、解壓縮Hadoop安裝包;5、配置Hadoop中相應(yīng)的文件即可。

          linux怎么安裝hadoop

          本文操作環(huán)境:ubuntu 16.04系統(tǒng)、Hadoop2.7.1版、Dell G3電腦。

          linux怎么安裝hadoop?

          【大數(shù)據(jù)】Linux下安裝Hadoop(2.7.1)詳解及WordCount運行

          一、引言

            在完成了Storm的環(huán)境配置之后,想著鼓搗一下Hadoop的安裝,網(wǎng)上面的教程好多,但是沒有一個特別切合的,所以在安裝的過程中還是遇到了很多的麻煩,并且最后不斷的查閱資料,終于解決了問題,感覺還是很好的,下面廢話不多說,開始進入正題。

            本機器的配置環(huán)境如下:

              Hadoop(2.7.1)

              Ubuntu Linux(64位系統(tǒng))

            下面分為幾個步驟來詳解配置過程。

          二、安裝ssh服務(wù)

            進入shell命令,輸入如下命令,查看是否已經(jīng)安裝好ssh服務(wù),若沒有,則使用如下命令進行安裝:

              sudo apt-get install ssh openssh-server

            安裝過程還是比較輕松加愉快的。

          三、使用ssh進行無密碼驗證登錄

            1.創(chuàng)建ssh-key,這里我們采用rsa方式,使用如下命令:

              ssh-keygen -t rsa -P ""

            2.出現(xiàn)一個圖形,出現(xiàn)的圖形就是密碼,不用管它

              cat ~/.ssh/id_rsa.pub >> authorized_keys(好像是可以省略的)

            3.然后即可無密碼驗證登錄了,如下:

              ssh localhost

            成功截圖如下:

              linux怎么安裝hadoop

          四、下載Hadoop安裝包

            下載Hadoop安裝也有兩種方式

              1.直接上官網(wǎng)進行下載,http://mirrors.hust.edu.cn/apache/hadoop/core/stable/hadoop-2.7.1.tar.gz

              2.使用shell進行下載,命令如下:

                wget http://mirrors.hust.edu.cn/apache/hadoop/core/stable/hadoop-2.7.1.tar.gz

            貌似第二種的方法要快點,經(jīng)過漫長的等待,終于下載完成。

          五、解壓縮Hadoop安裝包

            使用如下命令解壓縮Hadoop安裝包

              tar -zxvf hadoop-2.7.1.tar.gz

            解壓縮完成后出現(xiàn)hadoop2.7.1的文件夾

          六、配置Hadoop中相應(yīng)的文件

            需要配置的文件如下,hadoop-env.sh,core-site.xml,mapred-site.xml.template,hdfs-site.xml,所有的文件均位于hadoop2.7.1/etc/hadoop下面,具體需要的配置如下:

            1.core-site.xml 配置如下:    

          <configuration>       <property>         <name>hadoop.tmp.dir</name>         <value>file:/home/leesf/program/hadoop/tmp</value>         <description>Abase for other temporary directories.</description>       </property>       <property>         <name>fs.defaultFS</name>         <value>hdfs://localhost:9000</value>       </property>     </configuration>

            其中的hadoop.tmp.dir的路徑可以根據(jù)自己的習(xí)慣進行設(shè)置。

            2.mapred-site.xml.template配置如下:    

              <configuration>       <property>         <name>mapred.job.tracker</name>         <value>localhost:9001</value>       </property>     </configuration>

            3.hdfs-site.xml配置如下:

              <configuration>       <property>         <name>dfs.replication</name>         <value>1</value>       </property>       <property>         <name>dfs.namenode.name.dir</name>         <value>file:/home/leesf/program/hadoop/tmp/dfs/name</value>       </property>       <property>         <name>dfs.datanode.data.dir</name>         <value>file:/home/leesf/program/hadoop/tmp/dfs/data</value>       </property>     </configuration>

            其中dfs.namenode.name.dir和dfs.datanode.data.dir的路徑可以自由設(shè)置,最好在hadoop.tmp.dir的目錄下面。

            補充,如果運行Hadoop的時候發(fā)現(xiàn)找不到j(luò)dk,可以直接將jdk的路徑放置在hadoop.env.sh里面,具體如下:

              export JAVA_HOME="/home/leesf/program/java/jdk1.8.0_60"

          七、運行Hadoop

            在配置完成后,運行hadoop。

            1.初始化HDFS系統(tǒng)

              在hadop2.7.1目錄下使用如下命令:

             bin/hdfs namenode -format

              截圖如下:

              linux怎么安裝hadoop 

              過程需要進行ssh驗證,之前已經(jīng)登錄了,所以初始化過程之間鍵入y即可。

              成功的截圖如下:

              linux怎么安裝hadoop

              表示已經(jīng)初始化完成。

            2.開啟NameNodeDataNode守護進程

              使用如下命令開啟:

              sbin/start-dfs.sh,成功的截圖如下:

              linux怎么安裝hadoop

            3.查看進程信息

              使用如下命令查看進程信息

              jps,截圖如下:

              linux怎么安裝hadoop

              表示數(shù)據(jù)DataNode和NameNode都已經(jīng)開啟

            4.查看Web UI

              在瀏覽器中輸入http://localhost:50070,即可查看相關(guān)信息,截圖如下:

          linux怎么安裝hadoop

            至此,hadoop的環(huán)境就已經(jīng)搭建好了。下面開始使用hadoop來運行一個WordCount例子。

          八、運行WordCount Demo

            1.在本地新建一個文件,筆者在home/leesf目錄下新建了一個words文檔,里面的內(nèi)容可以隨便填寫。

            2.在HDFS中新建一個文件夾,用于上傳本地的words文檔,在hadoop2.7.1目錄下輸入如下命令:

              bin/hdfs dfs -mkdir /test,表示在hdfs的根目錄下建立了一個test目錄

              使用如下命令可以查看HDFS根目錄下的目錄結(jié)構(gòu)

              bin/hdfs dfs -ls /

              具體截圖如下:

              linux怎么安裝hadoop

              表示在HDFS的根目錄下已經(jīng)建立了一個test目錄

            3.將本地words文檔上傳到test目錄中

              使用如下命令進行上傳操作:

              bin/hdfs dfs -put /home/leesf/words /test/

              使用如下命令進行查看

              bin/hdfs dfs -ls /test/

              結(jié)果截圖如下:

              linux怎么安裝hadoop

              表示已經(jīng)將本地的words文檔上傳到了test目錄下了。

            4.運行wordcount

              使用如下命令運行wordcount:

              bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.1.jar wordcount /test/words /test/out

              截圖如下:

              linux怎么安裝hadoop

              運行完成后,在/test目錄下生成名為out的文件,使用如下命令查看/test目錄下的文件

              bin/hdfs dfs -ls /test

              截圖如下:

              linux怎么安裝hadoop

              表示在test目錄下已經(jīng)有了一個名為Out的文件目錄

              輸入如下命令查看out目錄下的文件:

              bin/hdfs dfs -ls /test/out,結(jié)果截圖如下:

              linux怎么安裝hadoop

              表示已經(jīng)成功運行了,結(jié)果保存在part-r-00000中。

            5.查看運行結(jié)果

              使用如下命令查看運行結(jié)果:

              bin/hadoop fs -cat /test/out/part-r-00000

              結(jié)果截圖如下:

              linux怎么安裝hadoop

            至此,運行過程就已經(jīng)完成了。

          九、總結(jié)

            在此次的hadoop配置過程遇到了很多問題,hadoop1.x和2.x的命令還是差別很大的,配置過程中還是一一的解決了問題,配置成功了,收獲也很多,特此把這次配置的經(jīng)驗分享出來,也方便想要配置hadoop環(huán)境的各位園友,在配置的過程中有任何問題都歡迎討論,謝謝各位園友的觀看~

          推薦學(xué)習(xí):《linux視頻教程》

          贊(1)
          分享到: 更多 (0)
          網(wǎng)站地圖   滬ICP備18035694號-2    滬公網(wǎng)安備31011702889846號