美文网首页我爱编程
hadoop-2.7.3集群的搭建

hadoop-2.7.3集群的搭建

作者: JustCode | 来源:发表于2017-06-01 17:10 被阅读49次
  • 设置静态IP

  • 关闭防火墙(如果没有关闭,上传文件到hdfs会出错,还存在其他错误)

  • 在hadoop-2.7.3\etc\hadoop\目录下修改配置文件

    1. 配置hadoop-env.sh
    • 设置JAVA_HOME

    • 配置yarn-env.sh

    • 配置JAVA_HOME

    • 配置slaves

      • 清空并添加
        slave1
        slave2
    • 配置core-site.xml,添加属性
      <--用来指定HDFS老大(NameNode)的地址-->
      <property>
      <name>fs.defaultFS</name>
      <value>hdfs://master:9000</value>
      </property>
      <--用来指定在序列文件中读写缓冲区的大小(128M)-->
      <property>
      <name>io.file.buffer.size</name>
      <value>131072</value>
      </property>
      <--用来指定Hadoop运行时产生文件的存放目录-->
      <property>
      <name>hadoop.tmp.dir</name>
      <value>file:/usr/app/install/hadoop-2.7.3/tmp</value>
      <description>Abase for other temporary directories.</description>
      </property>

    • 配置hdfs-site.xml,添加属性

      <property>
      <name>dfs.namenode.secondary.http-address</name>
      <value>master:9001</value>
      </property>
      <property>
      <name>dfs.namenode.name.dir</name>
      <value>file:/usr/app/install/hadoop-2.7.3/hdfs/name</value>
      </property>
      <property>
      <name>dfs.datanode.data.dir</name>
      <value>file:/usr/app/install/hadoop-2.7.3/hdfs/data</value>
      </property>
      <--指定HDFS保存数据副本的数量-->
      <property>
      <name>dfs.replication</name>
      <value>3</value>
      </property>
      <property>
      <name>dfs.webhdfs.enabled</name>
      <value>true</value>
      </property>
      <--指定block大小为128M-->
      <property>
      <name>dfs.blocksize</name>
      <value>134217728</value>
      </property>

    • 配置mapred-site.xml

      <property>
      <name>mapreduce.framework.name</name>
      <value>yarn</value>
      </property>
      <property>
      <name>mapreduce.jobhistory.address</name>
      <value>master:10020</value>
      </property>
      <property>
      <name>mapreduce.jobhistory.webapp.address</name>
      <value>master:19888</value>
      </property>

    • 配置yarn-site.xml

      <property>
      <name>yarn.nodemanager.aux-services</name>
      <value>mapreduce_shuffle</value>
      </property>
      <property>
      <name>yarn.resourcemanager.address</name>
      <value>master:8032</value>
      </property>
      <property>
      <name>yarn.resourcemanager.scheduler.address</name>
      <value>master:8030</value>
      </property>
      <property>
      <name>yarn.resourcemanager.resource-tracker.address</name>
      <value>master:8031</value>
      </property>
      <property>
      <name>yarn.resourcemanager.admin.address</name>
      <value>master:8033</value>
      </property>
      <property>
      <name>yarn.resourcemanager.webapp.address</name>
      <value>master:8088</value>
      </property>

  • ssh无密钥登录

  • 复制Hadoop配置好的包到其他Linux主机

  • 通过./bin/hdfs namenode -format 格式化hdfs

相关文章

网友评论

    本文标题:hadoop-2.7.3集群的搭建

    本文链接:https://www.haomeiwen.com/subject/lvxptxtx.html