<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    herodby
    技術(shù) 筆記
    posts - 14,  comments - 14,  trackbacks - 0

    1.     Hadoop基本組成

          NameNode 主要存放文件映射和文件更改日志

          SecondaryNameNode 一個守護(hù)進(jìn)程 定時(shí)從NameNode同步文件更改日志并合并成一條日志,方便hadoop每次重啟時(shí) 找到上次宕機(jī)的還原點(diǎn)。在后續(xù)的版本中會被backupNameNodenameNode集群取代。

          Jobtracker 任務(wù)調(diào)度守護(hù)進(jìn)程

          Tasktracker 任務(wù)執(zhí)行進(jìn)程

          DataName  數(shù)據(jù)存儲節(jié)點(diǎn),往往和Tasktracker部署在同一臺機(jī)器上。

    1.     安裝平臺:

    GNU/Linux hadoop不建議在win32平臺上使用,顧這里只介紹在linux系統(tǒng)上的 安裝和配置

    2.      所需的軟件:

    JavaTM1.5.x及以上的版本,必須安裝,建議選擇Sun公司發(fā)行的Java版本。

    ssh 必須安裝并且保證 sshd一直運(yùn)行,以便用Hadoop 腳本管理遠(yuǎn)端Hadoop守護(hù)進(jìn)程。

    3.     下載

      本文使用的是 hadoop-0.20.203.0,筆者當(dāng)前的穩(wěn)定版本。

    下載地址 http://hadoop.apache.org/common/releases.html#Download

     

    4.     部署

    本文 使用的是 4 linux機(jī)器,hadoop.master 作為namenode節(jié)點(diǎn),hadoop.second作為secondaryNameNode節(jié)點(diǎn),hadoop.slave1 作為第一datanode節(jié)點(diǎn),hadoop.slave2作為第二個datanode節(jié)點(diǎn)。

    5.     環(huán)境配置

    7.1  公共配置(集群中所有機(jī)器都需要的配置)

    Ø        編輯環(huán)境變量

    建議直接編輯 /etc/profile文件 增加 JAVA_HOMEHADOOP_HOME環(huán)境變量,具體事例如下所示:

       [root@hadoop ~]# vi /etc/profile

       增加如下幾行代碼

    export JAVA_OPTS='-Xms256m -Xmx512m'

    export JAVA_HOME=/usr/local/java

    export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

    export JRE_HOME=/usr/local/java/jre

    export PATH=$JAVA_HOME/bin:$PATH

    export HADOOP_HOME=/usr/local/hadoop

    export PATH=$PATH:$HADOOP_HOME/bin

    筆者為了以后方便起停hadoop hadoopbin也目錄加到path中。

       : wq

       讓環(huán)境變量即時(shí)生效

       [root@hadoop ~]# source /etc/profile

    Ø         修改 hosts文件

       [root@hadoop ~]# vi /etc/hosts

       在打開的文件中添加如下配置

       192.168.2.17 hadoop.master

    192.168.2.19 hadoop.slave1

    192.168.2.14 hadoop.slave2

    192.168.1.197 hadoop.second

       增加如上幾個域名,具體ip地址由各自的實(shí)際情況定,這里只列出筆者實(shí)驗(yàn)環(huán)境所需的。 Hadoop集群環(huán)境中 使用域名訪問的,所以需要把slavemaster等域名加到每臺服務(wù)器上。

    Ø        建立hadoop專屬用戶

       Groupadd  hadoop

       Useradd hadoop –g hadoop

       Passwd hadoop

       Changing password for user hadoop.

    New UNIX password:

    123456

    Retype new UNIX password:

    123456

    Ø        安裝軟件

       安裝JDK/usr/local下命名為java

    將下載好的hadoop-0.20.3.tar.gz文件上傳到master/usr/local/hadoop
    tar zxvf hadoop-0.20.3.tar.gz #
    解壓文件

    設(shè)置hadoop目錄的訪問權(quán)限

    chown –R hadoop:hadoop /usr/local/hadoop

    Ø        改機(jī)器名

         把每臺機(jī)器的 機(jī)器名改成localhost

         Vi /etc/sysconfig/network

         修改HOSTNAME  = localhost

         此處是沒搞清楚為什么的地方,實(shí)驗(yàn)結(jié)果表明 必須改成localhost hadoop才能正常啟動。具體原理 目前還沒有搞清楚,只知其然,其所以然有待于以后研究。 

    7.2  每個節(jié)點(diǎn)不同的配置

    7.2.1               配置hadoop

       Hadoop的配置文件 在早期版本中都放在同一個文件里 hadoop-site.xml,在新版本中hadoop把配置文件做了區(qū)分,分成了:

    Core-site.xml        配置Common組件的屬性

    Hadoop-site.xml      配置HDFS組件的屬性

    Mapred-site.xml      配置map-reduce組件的屬性

    除了這3個配置文件以外 還有 hadoop-env.xml 用來設(shè)置 hadoop用到的環(huán)境變量;masters文件用來配置 SNN 節(jié)點(diǎn)地址 注意必須配置域名slaves文件 配置所有DN節(jié)點(diǎn)的地址,必須是域名

    7.2.2            Core-site.xml 配置實(shí)例

     DN節(jié)點(diǎn) 以及 NN節(jié)點(diǎn),snn節(jié)點(diǎn)配置一至

       <property>

           <name>fs.default.name</name>           // 配置NN節(jié)點(diǎn)地址和端口號

           <value>hdfs://hadoop.master:9000</value>  //注意格式必須是 host:port的形式

    </property>

    <property>

           <name>hadoop.tmp.dir</name>           //hadoop臨時(shí)目錄用來存放nn臨時(shí)文件

           <value>/usr/local/hadoop/tmp</value>      //該目錄必須預(yù)先手工創(chuàng)建不能刪除

    </property>

    <property>

           <name>fs.checkpoint.period</name>      //snn檢查nn日志的時(shí)間周期

            <value>60</value>                   //單位是秒,正式環(huán)境上建議配置成12小時(shí)

    </property>

    <property>

            <name>fs.checkpoint.size</name>      //snn每次從nn上讀取的數(shù)據(jù)大小

            <value>67108864</value>            //通常情況下默認(rèn)值就可以

    </property>

    7.2.3                Hdfs-site.xml

    Ø         NN 節(jié)點(diǎn)

        <property>

            <name>dfs.name.dir</name>        // 指定name 鏡像文件存放目錄,如不指定則

            <value>/usr/local/hadoop/hdfs/name</value> //默認(rèn)為core-site中配置的tmp目錄

        </property>

    <property>

            <name>dfs.replication</name>     //數(shù)據(jù)節(jié)點(diǎn)冗余備份的數(shù)量,由于實(shí)驗(yàn)只有2

            <value>1</value>                // NN 顧設(shè)置唯一,實(shí)際配置是可由實(shí)際情況

        </property>                         //配置,建議盡量大于3

        <property>

            <name>dfs.permissions</name>    //是否需要角色權(quán)限驗(yàn)證,上傳文件時(shí)會用到,

            <value>false</value>             //如果為true ,需要綁定hadoop用戶角色

        </property>

        <property>

            <name>dfs.secondary.http.address</name>  //SNN web訪問地址。

            <value>hadoop.second:50090</value>

        </property>

    Ø         DN節(jié)點(diǎn)配置

        <property>

           <name>dfs.data.dir</name>             // 數(shù)據(jù)存放的目錄,如果不寫 默認(rèn)為

           <value>/usr/local/hadoop/hdfs/data</value>  // core-site中配置的tmp目錄

        </property>

        <property>

           <name>dfs.replication</name>      //數(shù)據(jù)節(jié)點(diǎn)冗余備份的數(shù)量,由于實(shí)驗(yàn)只有2

           <value>1</value>                 // NN 顧設(shè)置唯一,實(shí)際配置是可由實(shí)際情況

        </property>                         //配置,建議盡量大于3

        <property>

           <name>dfs.permissions</name>     //是否需要角色權(quán)限驗(yàn)證,上傳文件時(shí)會用到

           <value>false</value>              //如果為true ,需要綁定hadoop用戶角色

        </property>

        <property>

           <name>dfs.secondary.http.address</name>   //SNN web訪問地址

           <value>hadoop.second:50090</value>

    </property>

    Ø           SN節(jié)點(diǎn)的配置

        <property>

           <name>dfs.name.dir</name> // 指定name 鏡像文件存放目錄,如不指定則

           <value>/usr/local/hadoop/hdfs/name</value> //默認(rèn)為core-site中配置的tmp目錄

        </property>

        <property>

           <name>dfs.replication</name>    //數(shù)據(jù)節(jié)點(diǎn)冗余備份的數(shù)量,由于實(shí)驗(yàn)只有2

           <value>1</value>                // NN 顧設(shè)置唯一,實(shí)際配置是可由實(shí)際情況

        </property>                       //配置,建議盡量大于3

        <property>

           <name>dfs.permissions</name>

           <value>false</value>

        </property>

        <property>

            <name>dfs.http.address</name>    NN web訪問地址,注意此處和其他節(jié)點(diǎn)不同

            <value>hadoop.master:50070</value>

        </property>

    Ø         Mapred-site.xml配置

    所有節(jié)點(diǎn)都一致

      <property>

        <name>mapred.job.tracker</name>

        <value>hadoop.master:9001</value> //必須為hostport的形式,不能直接寫ip

      </property>

    Jobtracker的分布式的配置方法目前沒設(shè)置成功,有待于繼續(xù)研究

    Ø         Masters文件配置和slaves文件配置 所有節(jié)點(diǎn)全部一致

    所有節(jié)點(diǎn)的masters 里面均配置 SNN的域名

    所有節(jié)點(diǎn)的slaves 里面均配置所有DN的域名,一行一個DN

    Ø         Hadoop-env.sh 文件配置

    里面是hadoop運(yùn)行時(shí)定義的環(huán)境變量

    其他的都可以用默認(rèn)值,但是有一項(xiàng)必須修改 就是javahome環(huán)境變量,指定到實(shí)際的javahome目錄。實(shí)例:

     export JAVA_HOME=/usr/local/java  

    1.     hadoop無用戶登錄配置

    hadoop用戶進(jìn)入每臺機(jī)器:

    進(jìn)入 /home/hadoop 目錄

    ssh-keygen -t rsa  #建立ssh目錄,敲回車到底

    1)        登錄NN服務(wù)器

    2)        進(jìn)入/home/hadoop/.ssh目錄

    3)        scp -r id_rsa.pub hadoop@hadoop.slave1:/home/hadoop/.ssh/authorized_keys

    #master上的密鑰傳到slave1hadoop用戶下,重命名為authorized_keys

    4)        scp -r id_rsa.pub hadoop@hdoop.slave2:/home/hadoop/.ssh/authorized_keys

    #master上的密鑰傳到slave2hadoop用戶下,重命名為authorized_keys

    5)        scp -r id_rsa.pub hadoop@hadoop.second:/home/hadoop/.ssh/authorized_keys

    #master上的密鑰傳到snnhadoop用戶下,重命名為authorized_keys

     

    6)        hadoop用戶進(jìn)入hadoop.slave1 /home/hadoop/.ssh目錄

    7)        cat id_rsa.pub >> authorized_keys

    #把自己的id_rsa.pub內(nèi)容也放到authorized_keys

    8)        scp -r id_rsa.pub hadoop@hadoop.master:/home/hadoop/.ssh/authorized_keys_s1
    #
    slave1上的密鑰傳到masterhadoop用戶下

     

    9)        hadoop用戶進(jìn)入hadoop.slave2  /home/hadoop/.ssh目錄

    10)     cat id_rsa.pub >> authorized_keys

    #把自己的id_rsa.pub內(nèi)容也放到authorized_keys

    11)     scp -r id_rsa.pub hadoop@hadoop.master:/home/hadoop/.ssh/authorized_keys_s2
    #
    slave2上的密鑰傳到masterhadoop用戶下

    12)     hadoop用戶進(jìn)入hadoop.second  /home/hadoop/.ssh目錄

    13)     cat id_rsa.pub >> authorized_keys

    #把自己的id_rsa.pub內(nèi)容也放到authorized_keys

    14)     scp -r id_rsa.pub hadoop@hadoop.master:/home/hadoop/.ssh/authorized_keys_second
    #
    snn上的密鑰傳到masterhadoop用戶下

     

    15)     master,上執(zhí)行以下操作

    16)     cat id_rsa.pub >> authorized_keys

    #將本地密鑰添加authorized_keys

    17)     cat authorized_keys_s1 >> authorized_keys

    18)     cat authorized_keys_s2 >> authorized_keys

    19)     cat authorized_keys_second >> authorized_keys

    20)     rm authorized_keys_second

    21)     rm authorized_keys_s1

    22)     rm authorized_keys_s2

    這樣主節(jié)點(diǎn)和從節(jié)點(diǎn)之間就可以不用密碼直接ssh訪問

    特別注意 authorized_keys 文件的訪問權(quán)限 必須設(shè)置成600

    登錄每臺機(jī)器 執(zhí)行 chmod 600 authorized_keys

    2.     啟動hadoop

    hadoop用戶進(jìn)入nn服務(wù)器的 /usr/local/hadoop/hadoop-0.20.203.0/bin目錄

    Ø         格式化hadoop

    Hadoop namenode –format

    Ø         啟動hadoop

    ./start-all.ssh  ,不建議這樣啟動 建議單獨(dú)啟動守護(hù)進(jìn)程。

    Ø         Hadoop日志目錄

    /usr/local/hadoop/hadoop-0.20.203.0/logs

    啟動完檢查下啟動日志,啟動后 nn上查看

    hadoop-hadoop-namenode-master.log

    hadoop-hadoop-jobtracker-master.log

    因?yàn)?/span> 我們的 nn jobtracker 部署在同一臺機(jī)器上,所有master上會有2個日志

    登錄snn節(jié)點(diǎn)服務(wù)器 查看

    hadoop-hadoop-secondarynamenode-master.log

    這幾個沒錯誤就OK

    這時(shí)候就可以進(jìn)入管理頁面看看了


    posted on 2011-12-08 13:14 鄧兵野 閱讀(3507) 評論(2)  編輯  收藏

    FeedBack:
    # re: 基于hadoop的云計(jì)算 第一篇 安裝配置篇
    2011-12-10 13:03 | tb
    好資料 學(xué)習(xí)了   回復(fù)  更多評論
      
    # re: 基于hadoop的云計(jì)算 第一篇 安裝配置篇
    2011-12-16 18:58 | -274°C
    好資料,收藏了,改天仔細(xì)看。  回復(fù)  更多評論
      

    只有注冊用戶登錄后才能發(fā)表評論。


    網(wǎng)站導(dǎo)航:
     

    <2011年12月>
    27282930123
    45678910
    11121314151617
    18192021222324
    25262728293031
    1234567

    常用鏈接

    留言簿(2)

    隨筆分類

    隨筆檔案

    文章分類

    文章檔案

    搜索

    •  

    最新評論

    閱讀排行榜

    評論排行榜

    主站蜘蛛池模板: 96免费精品视频在线观看| 88av免费观看| 91精品啪在线观看国产线免费| 最近免费中文字幕大全| 亚洲人成网站色在线入口| 亚洲高清日韩精品第一区| 美女隐私免费视频看| 1000部无遮挡拍拍拍免费视频观看| 国产精品成人免费综合| 亚洲第一极品精品无码久久| 亚洲日韩精品无码专区加勒比☆ | 亚洲欧洲日本在线| 亚洲天堂一区二区三区| 一级中文字幕乱码免费| 国产日本一线在线观看免费| 亚洲自偷自偷偷色无码中文| 日本亚洲色大成网站www久久| 免费在线观影网站| 免费大香伊蕉在人线国产 | 久久久久亚洲AV无码专区网站 | 精品亚洲成a人片在线观看少妇| 国产成人va亚洲电影| **aaaaa毛片免费| 久久精品国产亚洲Aⅴ香蕉 | 亚洲人成欧美中文字幕| 无码国产精品一区二区免费3p| 免费在线观看的黄色网址| 亚洲性一级理论片在线观看| 中国一级特黄高清免费的大片中国一级黄色片| 国产精品无码免费播放| 亚洲成在人天堂在线| 一级毛片在线播放免费| 日韩精品视频免费网址| 亚洲日本国产精华液| 毛片在线播放免费观看| 亚洲精品高清一二区久久| MM1313亚洲国产精品| 久久这里只有精品国产免费10| 亚洲人成在线影院| 成在人线av无码免费高潮水 | 亚洲AV无码专区电影在线观看 |