美文网首页Hadoop大数据我爱编程
Hadoop中的Staging(客户端缓存)机制

Hadoop中的Staging(客户端缓存)机制

作者: dpengwang | 来源:发表于2018-05-17 18:24 被阅读8次

客户端创建文件的请求其实并没有立即发送给 NameNode,事实上,在刚开始阶段HDFS客户端会先将文件数据缓存到本地的一个临时文件。应用程序的写操作被透明地重定向到这个临时文件。当这个临时文件累积的数据量超过一个数据块的大小,客户端才会联系NameNode。
NameNode 将文件名插入文件系统的层次结构中,并且 分配一个数据块给它。然后返回 DataNode 的标识符和目标数据块给客户端。接着客 户端将这块数据从本地临时文件上传到指定的 DataNode 上。当文件关闭时,在临时文件中剩余的没有上传的数据也会传输到指定的 DataNode 上。然后客户端告诉 NameNode 文件已经关闭。此时 NameNode 才将文件创建操作提交到日志里进行存 储。如果 NameNode 在文件关闭前宕机了,则该文件将丢失。 上述方法是对在 HDFS 上运行的目标应用进行认真考虑后得到的结果。这些应用 需要进行文件的流式写入。如果不采用客户端缓存,由于网络速度和网络堵塞会对吞 估量造成比较大的影响。
这种方法并不是没有先例的,早期的文件系统,比如 AFS, 就用客户端缓存来提高性能。为了达到更高的数据上传效率,已经放松了 POSIX 标准 的要求。

相关文章

  • Hadoop中的Staging(客户端缓存)机制

    客户端创建文件的请求其实并没有立即发送给 NameNode,事实上,在刚开始阶段HDFS客户端会先将文件数据缓存到...

  • HTTP缓存机制

    HTTP缓存机制 前言 ​ 缓存机制无处不在,有客户端缓存,服务端缓存,代理服务器缓存等。在HTTP中具有缓存...

  • 【HTTP】缓存机制

    前言 缓存机制无处不在,有客户端缓存,服务端缓存,代理服务器缓存等。在HTTP中具有缓存功能的是浏览器缓存。 HT...

  • HTTP----HTTP缓存机制

    前言 缓存机制无处不在,有客户端缓存,服务端缓存,代理服务器缓存等。在HTTP中具有缓存功能的是浏览器缓存。 HT...

  • HTTP缓存机制

    一、缓存可以用来干什么? http缓存机制是web性能优化的重要手段。 二、缓存规则解析 客户端第...

  • 【Mac大数据开发】第八篇-HDFS读写机制详解

    1. 写数据机制 Hadoop写入数据的机制和流程如下图所示简述:客户端与namenode创建连接,namenod...

  • 简述http协议缓存原理及常用首部讲解

    前言 http协议的缓存机制可以大大减轻客户端向服务器发送的请求次数,从而减少服务器的负载压力;与此同时,缓存机制...

  • iOS源码解析—YYCache(概述)

    概述 YYCache是一个用来封装客户端缓存功能的库,实现了二级缓存的机制,即同时具备内存缓存和硬盘缓存的功能。 ...

  • 浏览器的缓存策略

    关于缓存策略 自动化的缓存机制(基于服务端和客户端协商的) 分级缓存策略(3层):(1层)200状态 : 当浏览器...

  • HDFS集中式缓存管理

    Hadoop从2.3.0版本开始支持HDFS缓存机制,HDFS允许用户将一部分目录或文 件缓存在HDFS当中,Na...

网友评论

    本文标题:Hadoop中的Staging(客户端缓存)机制

    本文链接:https://www.haomeiwen.com/subject/iwridftx.html