美文网首页
hadoop基本操作

hadoop基本操作

作者: __method__ | 来源:发表于2020-10-26 11:43 被阅读0次

启动HDFS

  • 来到$HADOOP_HOME/sbin目录下
  • 执行start-dfs.s
[hadoop@hadoop000 sbin]$ ./start-dfs.sh 
  • 可以看到 namenode和 datanode启动的日志信息
20/10/26 09:49:39 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
Starting namenodes on [hadoop000]
hadoop000: Warning: Permanently added the RSA host key for IP address '10.25.187.18' to the list of known hosts.
hadoop000: starting namenode, logging to /home/hadoop/app/hadoop-2.6.0-cdh5.7.0/logs/hadoop-hadoop-namenode-hadoop000.out
hadoop000: starting datanode, logging to /home/hadoop/app/hadoop-2.6.0-cdh5.7.0/logs/hadoop-hadoop-datanode-hadoop000.out
  • 通过jps命令查看当前运行的进程
[hadoop@hadoop000 sbin]$ jps
4249 NameNode
4351 DataNode
4613 SecondaryNameNode
4733 Jps

通过可视化界面查看HDFS的运行情况

  • 通过浏览器查看 主机ip:50070端口


    图片.png
  • Overview界面查看整体情

  • Datanodes界面查看datanode的情况

HDFS shell操作

ls

使用方法:

hadoop fs -ls <args>

如果是文件,则按照如下格式返回文件信息:
文件名 <副本数> 文件大小 修改日期 修改时间 权限 用户ID 组ID
如果是目录,则返回它直接子文件的一个列表,就像在Unix中一样。目录返回列表的信息如下:
目录名 <dir> 修改日期 修改时间 权限 用户ID 组ID
示例:

hadoop fs -ls /user/hadoop/file1 /user/hadoop/file2 hdfs://host:port/user/hadoop/dir1 /nonexistentfile 

返回值:
成功返回0,失败返回-1

mv

使用方法:

hadoop fs -mv URI [URI …] <dest>

将文件从源路径移动到目标路径。这个命令允许有多个源路径,此时目标路径必须是一个目录。不允许在不同的文件系统间移动文件。
示例:

- hadoop fs -mv /user/hadoop/file1 /user/hadoop/file2
- hadoop fs -mv hdfs://host:port/file1 hdfs://host:port/file2 hdfs://host:port/file3 hdfs://host:port/dir1

返回值:

成功返回0,失败返回-1。

put

使用方法:

hadoop fs -put <localsrc> ... <dst>

从本地文件系统中复制单个或多个源路径到目标文件系统。也支持从标准输入中读取输入写入目标文件系统。

返回值:

成功返回0,失败返回-1。

rm

使用方法:

hadoop fs -rm URI [URI …]

删除指定的文件。只删除非空目录和文件。请参考rmr命令了解递归删除。
示例:

返回值:

成功返回0,失败返回-1。

  • 在centos 中创建 test.txt
touch test.txt
  • 在centos中为test.txt 添加文本内容
vi test.txt
  • 查看hdfs中 / 下的文件情况
hadoop fs -ls /
  • 在HDFS中创建 hadoop001/test 文件夹
hadoop fs -mkdir -p /hadoop001/test
  • 把text.txt文件上传到HDFS中
hadoop fs -put test.txt /hadoop001/test/
  • 查看hdfs中 hadoop001/test/test.txt 文件内容
hadoop fs -cat /hadoop001/test/test.txt
  • 将hdfs中 hadoop001/test/test.txt文件下载到centos
 hadoop fs -get /hadoop001/test/test.txt test.txt
  • 将 /hadoop001/test/test.txt test.txt 移动到 /tmp
hadoop fs -mv /hadoop001/test/test.txt test.txt /tmp
  • 删除HDFS中 /tmp
hadoop fs -rm -r /tmp

HDFS设计思路

分布式文件系统的设计思路:


HDFS架构

  • 1个NameNode/NN(Master) 带 DataNode/DN(Slaves) (Master-Slave结构)
  • 1个文件会被拆分成多个Block
  • NameNode(NN) 负责客户端请求的响应
    负责元数据(文件的名称、副本系数、Block存放的DN)的管理 元数据 MetaData 描述数据的数据 监控DataNode健康状况 10分钟没有收到DataNode报告认为Datanode死掉了
  • DataNode(DN) 存储用户的文件对应的数据块(Block)
    要定期向NN发送心跳信息,汇报本身及其所有的block信息,健康状况
  • 分布式集群NameNode和DataNode部署在不同机器上


  • HDFS优缺点
    • 优点
      • 数据冗余 硬件容错
      • 适合存储大文件
      • 处理流式数据
      • 可构建在廉价机器上
    • 缺点
      • 低延迟的数据访问
      • 小文件存储

HDFS环境搭建

  • 下载jdk 和 hadoop 放到 /sLL/app目录下
tar -zxvf 压缩包名字 -C ~/app/
tar -vxzf jdk-7u79-linux-x64.tar.gz -C ~/app/
tar -vxzf hadoop-2.6.0-cdh5.7.0.tar.gz -C ~/app/
  • 配置环境变量
vi ~/.bash_profile

添加环境变量

export JAVA_HOME=/home/hadoop/app/jdk1.8.0_91
export PATH=$JAVA_HOME/bin:$PATH
export HADO::OP_HOME=/home/hadoop/app/hadoop......
export PATH=$HADOOP_HOME/bin:$PATH

保存退出后, 让.bash_profile立即生效

source ~/.bash_profile

进入到解压后的hadoop目录 修改配置文件

配置文件作用
  • core-site.xml 指定hdfs的访问方式
  • hdfs-site.xml 指定namenode 和 datanode 的数据存储位置
  • mapred-site.xml 配置mapreduce
  • yarn-site.xml 配置yarn
修改hadoop.env.sh
export_JAVA_HOME = /home/app/jdk1.7

- 修改 core-site.xml 在 <configuration>节点中添加 (默认hdfs的地址 8020)

<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://hadoop000:8020</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/home/hadoop/app/tmp</value>
</property>
  • 修改hdfs-site.xml 在 configuration节点中添加
    单节点伪分布式
<configuration>
<property>
            <name>dfs.replication</name>
                        <value>1</value>
                                </property>
</configuration>

集群

<property>
    <name>dfs.namenode.name.dir</name>
    <value>/home/hadoop/app/tmp/dfs/name</value>
</property>
<property>
    <name>dfs.datanode.data.dir</name>
    <value>/home/hadoop/app/tmp/dfs/data</value>
</property>
<property>
    <name>dfs.replication</name>
    <value>1</value>
</property>
来到hadoop的bin目录
./hadoop namenode -format (这个命令只运行一次)

相关文章

  • hadoop基本操作

    启动HDFS 来到$HADOOP_HOME/sbin目录下 执行start-dfs.s 可以看到 namenode...

  • hadoop 基础笔记

    hdfs hadoop shell的基本操作 Yarn hadoopx.xx/share/hadoop/mapre...

  • hadoop学习大纲

    Hadoop集群环境搭建 Hadoop集群环境搭建 HDFS 图说HDFS基本原理hadoop的shell命令操作...

  • Hadoop课程大纲

    Hadoop集群环境搭建 Hadoop集群环境搭建 HDFS 图说HDFS基本原理hadoop的shell命令操作...

  • Hadoop课程大纲

    Hadoop集群环境搭建 Hadoop集群环境搭建 HDFS 图说HDFS基本原理hadoop的shell命令操作...

  • Hadoop 课程大纲

    Hadoop集群环境搭建 Hadoop集群环境搭建 HDFS 图说HDFS基本原理hadoop的shell命令操作...

  • hadoop 操作HDFS 命令

    hadoop HDFS常用文件操作命令 命令基本格式: hadoop fs -cmd < args > 1.ls ...

  • hadoop基本操作2

    yarn Yet Another Resource Negotiator, 另一种资源协调者 通用资源管理系统 为...

  • 3、HBase Shell操作

    基本操作 进入HBase客户端命令行[hadoop@hadoop-100 hbase]$ cd bin/hbase...

  • HBase | 基本操作

    基本操作 hbase shell hbase程序 java -cp hadoop.jar com.icebreak...

网友评论

      本文标题:hadoop基本操作

      本文链接:https://www.haomeiwen.com/subject/hftamktx.html