美文网首页
Mapreduce shuffle简单过程

Mapreduce shuffle简单过程

作者: Nougats | 来源:发表于2017-04-18 22:11 被阅读0次

shuffle(洗牌)把mapper阶段的结果拷贝到reducer阶段
分为两部分,mapshuffle,reduceshuffle

  • mapshuffle:map的输出结果输出到内存的缓冲区,缓冲区数量和map数量对应,缓冲区有百分比,map写入缓冲区超过了这个百分比,就会自动刷入map的机器本地磁盘
    内存在这里做了一些操作:分区(和reduce数量一致),排序,map的输出结果不断地从缓冲区中刷出,刷出多个文件,后台会有一个线程按照分区合并这些文件
  • reduceshuffle:会拷贝map的结果,把文件先做一个排序,再做合并,这些数据作为reduce的输入

相关文章

网友评论

      本文标题:Mapreduce shuffle简单过程

      本文链接:https://www.haomeiwen.com/subject/eiiqzttx.html