有哪些常用的配置文件，配置哪些屬性來構建hadoop集群？

壹.導言

在查閱了很多在線教程後，hadoop終於在ubuntu14.04中安裝配置成功。詳細的安裝步驟如下所述。我使用的環境:兩臺ubuntu 14.04 64位桌面，hadoop選擇2.7.1版本。(單機版的配置主要在前面介紹，集群版基於單機版，主要是配置文件不壹樣，後面會詳細說明。)

二。準備工作

2.1創建用戶

創建壹個用戶並向其添加root權限。經過個人驗證，下面這個方法比較好。

1 sudo adduser Hadoop 2 sudo vim/etc/sudoers 3 #修改如下:4 root all =(all)all 5 Hadoop all =(all)all。

為hadoop用戶創建壹個目錄，並將其添加到sudo用戶組中。該命令如下所示:

1 sudo ChownHadoop/Home/Hadoop 2 #添加到Sudo用戶組3 sudo adduser hadoop sudo。

最後，註銷當前用戶，使用新創建的hadoop用戶登錄。

2.2?安裝ssh服務

默認情況下，ubuntu中沒有安裝ssh服務器(只有ssh客戶端)，所以首先運行下面的命令來安裝openssh-server。安裝過程輕松愉快~

安裝ssh openssh-server

2.3配置ssh無密碼登錄

直接編碼:執行下面的代碼後，可以直接登錄(可以運行ssh localhost進行驗證)。

1 cd ~/。ssh #如果找不到這個文件夾，首先執行“ssh localhost”2sh-keygen-t RSA 3c PID _ RSA . pub authorized _ keys。

註意:

這裏實現的是自己無密登錄，只適用於hadoop單機環境。如果您配置Hadoop集群並設置主服務器和從服務器的SSH非秘密登錄，您可以

三。安裝過程

3.1下載hadoop安裝包

有兩種下載方法:

1.直接去官網下載:

2.使用wget命令下載:

3.2配置hadoop

1.解壓下載的hadoop安裝包，修改配置文件。我的解壓目錄是(/home/hadoop/Hadoop-2 . 7 . 1)，即進入/home/Hadoop/文件夾，執行下面的解壓命令。

tar-zxvf Hadoop-2 . 7 . 1 . tar . gz

2.修改(hadoop2.7.1/etc/hadoop/)目錄下的配置文件:hadoop-env.sh，core-site.xml，mapred-site.xml.template，hdfs-site.xml。

(1).core-site.xml配置:hadoop.tmp.dir的路徑可以根據自己的習慣設置。

& lt配置& gt& lt屬性& gt& lt名稱& gtHadoop . tmp . dir & lt；/name & gt；& lt值& gtfile:/home/Hadoop/Hadoop/tmp & lt；/value & gt；& lt描述& gt其他臨時目錄的基礎。& lt/description & gt；& lt/property & gt；& lt屬性& gt& lt名稱& gtfs.defaultFS & lt/name & gt；& lt值& gthdfs://localhost:9000</value & gt；& lt/property & gt；& lt/configuration & gt；

(2).？Mapred-site.xml.template配置:？

& lt配置& gt& lt屬性& gt& lt名稱& gtmapred . job . tracker & lt；/name & gt；& lt值& gtlocalhost:9001 & lt；/value & gt；& lt/property & gt；& lt/configuration & gt；

(3).？Hdfs-site.xml配置:？dfs.namenode.name.dir和dfs.datanode.data.dir的路徑可以自由設置，最好在hadoop.tmp.dir目錄下

註意:如果運行Hadoop時發現找不到jdk，可以直接把jdk的路徑放在hadoop-env.sh中，如下:

export java _ home = "/opt/Java _ file/JDK 1 . 7 . 0 _ 79 "，這是安裝Java時的路徑。

& lt配置& gt& lt屬性& gt& lt名稱& gtdfs.replication & lt/name & gt；& lt值& gt1 & lt；/value & gt；& lt/property & gt；& lt屬性& gt& lt名稱& gtDFS . NameNode . name . dir & lt；/name & gt；& lt值& gtfile:/home/Hadoop/Hadoop/tmp/DFS/name & lt；/value & gt；& lt/property & gt；& lt屬性& gt& lt名稱& gtDFS . datanode . data . dir & lt；/name & gt；& lt值& gtfile:/home/Hadoop/Hadoop/tmp/DFS/data & lt；/value & gt；& lt/property & gt；& lt/configuration & gt；

配置完成後運行hadoop。

第四步:運行hadoop

4.1?初始化HDFS系統

執行hadop2.7.1目錄下的命令:

bin/hdfs命名節點格式

以下結果表明初始化是成功的。

4.2?開放？NameNode？然後呢。DataNode？守護進程

執行hadop2.7.1目錄下的命令:

sbin/start-dfs.sh

成功截圖如下:

4.3使用jps命令查看流程信息:

如果出現如圖所示的結果，說明DataNode和NameNode都已經打開。