美文网首页
经典漫画讲解HDFS存储机制与运行原理

经典漫画讲解HDFS存储机制与运行原理

作者: knowalker | 来源:发表于2017-07-22 11:23 被阅读107次
image.png

根据Maneesh Varshney的漫画改编,以简洁易懂的漫画形式讲解HDFS的存储机制与运行原理。
1、构成部分
HDFS存储相关角及功能如下:
Client:客户端,系统使用者,调用HDFS API操作文件;与NN交互获取文件元数据;与DN交互进行数据读写。

Namenode:元数据节点,是系统唯一的管理者。负责元数据的管理;与client交互进行提供元数据查询;分配数据存储节点等。

Datanode:数据存储节点,负责数据块的存储与冗余备份;执行数据块的读写操作等。

2、写数据过程
HDFS中的存储单元是block。文件通常被分成64或128M一块的数据块进行存储。与普通文件系统不同的是,在HDFS中,如果一个文件大小小于一个数据块的大小,它是不需要占用整个数据块的存储空间的。


3、读取数据过程
HDFS采用的是“一次写入多次读取”的文件访问模型。一个文件经过创建、写入和关闭之后就不需要改变。这一假设简化了数据一致性问题,并且使高吞吐量的数据访问成为可能。

4、容错第一部分:故障类型及其检测方法(namenode 故障、网络故障和脏数据问题)


5、容错第二部分:读写容错

6、容错第三部分:dataNode 失效

7、备份规则
数据块的第一个副本优先放在写入数据块的客户端所在的节点上,但是如果这个客户端上的数据节点空间不足或者是当前负载过重,则应该从该数据节点所在的机架中选择一个合适的数据节点作为本地节点。

如果客户端上没有一个数据节点的话,则从整个集群中随机选择一个合适的数据节点作为此时这个数据块的本地节点。
HDFS的存放策略是将一个副本存放在本地机架节点上,另外两个副本放在不同机架的不同节点上。

这样集群可在完全失去某一机架的情况下还能存活。同时,这种策略减少了机架间的数据传输,提高了写操作的效率,因为数据块只存放在两个不同的机架上,减少了读取数据时需要的网络传输总带宽。这样在一定程度上兼顾了数据安全和网络传输的开销。

8、结束语

相关文章

  • 经典漫画讲解HDFS存储机制与运行原理

    根据Maneesh Varshney的漫画改编,以简洁易懂的漫画形式讲解HDFS的存储机制与运行原理。1、构成部分...

  • HDFS的读写机制

    本篇博客讲解了HDFS的读机制和写机制,通过一个实例演示了HDFS的文件存储过程,非常通俗易懂。 1、客户端写文件...

  • 近期学习目标

    安卓部分机制的原理 界面绘制 后台运行 数据存储 线程机制 Service 广播 网络编程 http协议 XML/...

  • Storm整合 HDFS/HBase

    一、整合HDFS 新增hdfs的pom包 修改前面讲解的wordCount的示例 HDFS存储 二、整合HBase...

  • 图文详解HDFS工作机制

    本篇主要从下面几个方面进行展开 HDFS是什么 漫画看懂HDFS骚操作 HDFS架构原理 一、HDFS是什么 HD...

  • 考试脑科学(328/365天读书分享)

    这本书结合脑科学前沿研究,通俗地讲解了人脑“记住与遗忘”的原理,不仅呈现了人脑筛选、存储信息的奇妙机制,还向...

  • 大脑记忆的那些事(二)

    在上一篇文章中讲解了大脑是如何记忆存储东西的原理后,这一篇将要介绍如何根据大脑的运作原理机制,更加有效的记忆与学习...

  • Linux-内存管理机制

    参看链接:浅谈Linux的内存管理机制 为什么内存运行速度比硬盘运行速度快? 存储原理完全不同: 内存(随机存储器...

  • requests,selenium,appium自动化底层原理

    Charles-MQ appium ,selenium ,webdriver 运行原理与机制 requests底层...

  • PHP递归函数

    很多同学在学习递归函数的时候会感到头晕,无法搞清楚递归函数的原理和运行机制,本文将给大家详细讲解递归函数的运行机制...

网友评论

      本文标题:经典漫画讲解HDFS存储机制与运行原理

      本文链接:https://www.haomeiwen.com/subject/hixukxtx.html