HDFS实践

作者: 大数据阶梯之路 | 来源:发表于2019-07-22 00:22 被阅读4次

前言:这次学习实际操作跟hdfs交互,hadoop fs命令代表着hadoop的file system文件系统。要操作hdfs就需要跟这个前缀命令打交道。

一、往hdfs上传文件

实验目的:观察如何往hdfs上传文件,并通过网页界面查看超过128m的文件分块和存储情况。
实验命令:hadoop fs -put 文件路径
实际操作如下图:

图片.png

二、hdfs的增删改查

hadoop fs -mkdir 文件目录   //增
hadoop fs -rm 文件名   //删
hadoop fs -text 文件名   //改
hadoop fs -ls 文件路径   //查

三、修改hdfs的配置文件

在<configuration>标签组里添加<property>配置

  • 下面这个标签属性是配置文件默认的备份分数,比如设置为2这样文件在hdfs中就备份2份。
<property>
  <name>dfs.replication</name>
  <value>2</value>
</property>
  • 下面这个标签属性是设置hadoop每隔多长时间检查集群机器中的哪些机器宕机了,默认为300000毫秒(即5分钟),我们可以设置短一些(比如10000毫秒,即1分钟)。注意:集群机器宕机了一两台是不会影响集群对外提供服务的,因为集群本就是多台机器为同一个任务服务。
<property>
  <name>dfs.namenode.heartbeat.recheck-interval</name>
  <value>10000</value>
</property>
  • 下面这个标签属性是用来配置hdfs取消用户权限检查的
<property>
        <name>dfs.permissions</name>
        <value>false</value>
</property>

还有许多属性没记录到,需要的时候百度或者查api就足够了。

最后放一个HDFS的理论篇,别人以漫画的形式写的。
https://mp.weixin.qq.com/s/8p6R8j2LLmFcaenOtVywVg

相关文章

网友评论

    本文标题:HDFS实践

    本文链接:https://www.haomeiwen.com/subject/ikwbhctx.html