【Mac大数据开发】第六篇-HDFS简介

作者: irving_yuan | 来源:发表于2019-06-26 16:54 被阅读0次

【Mac大数据开发】第六篇-HDFS简介
HDFS
HDFS基础
HDFS深度历险之从客户端逻辑看HDFS写入机制
HDFS 体系结构指南
HDFS中API的使用
Hadoop框架：HDFS简介与Shell管理命令
hadoop简介
成都大数据开发技术知识点，加米谷大数据培训
10亿+文件数压测，阿里云JindoFS轻松应对

1. 概念

HDFS是一个分布式文件系统，Hadoop distributed file system。通过树形结构定位文件，由多台服务组合实现其功能，集群中各个机器具有自己的角色

2. 组成

HDFS集群包括NameNode，DataNode，SecondaryNameNode

NameNode
负责管理整个文件系统的元数据，以及每一个路径对应的数据块信息
DataNode
负责管理用户的文件数据块，每个块都可以再多dataNode上存在副本
SecondaryNameNode
负责监控HDFS状态的辅助节点，每个一段时间对NameNode的元数据进行合并

3. HDFS块的大小

HDFS中默认块大小128M（2版本以前是64M），可以通过dir.blocksize来进行设置。
通常这个块的大小远大与磁盘上的块（512Byte），目的是使访问数据时寻址所占用时间比例最低，访问效率（磁盘传输时间 / 磁盘传输时间 + 文件寻址时间）更高

把更多的时间用于传输

例如，目前磁盘的传输效率大约100M/s，而寻址时间通常是10ms，通常寻址时间占总共传输时间的1%。因此，每个块100M是比较合适的大小。（大量生产实践的结果）

4. HDFS的常用操作

基础命令格式

hadoop fs -具体指令

常见的指令与linux中相似，如

hadoop fs -ls / # 查看目录
hadoop fs -cat /aaa  # 查看文件
hadoop fs -put a.txt /dir # 上传文件
hadoop fs -get /dir/a.txt /opt/test # 下载文件
hadoop fs -rm -rf /dir/a.txt # 删除文件/目录

等等命令

网友评论

本文标题：【Mac大数据开发】第六篇-HDFS简介

本文链接：https://www.haomeiwen.com/subject/vvgccctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

【Mac大数据开发】第六篇-HDFS简介

1. 概念

2. 组成

3. HDFS块的大小

4. HDFS的常用操作

相关文章