美文网首页
今日份spark(三)

今日份spark(三)

作者: 日更专用小马甲 | 来源:发表于2019-05-11 22:28 被阅读0次

ClusterManager负责资源管理,比如YARN。

Driver负责向资源管理器申请资源,资源也就是Worker节点。

之前一直以为Driver等同于Master,其实Driver只是拥有Main方法入口的那个节点,概念上跟Executor对应。另一组对应关系是Master跟Worker对应。

提交任务时,如果是Client模式,则Driver就运行在Client端;如果是Cluster模式,则Driver运行在某个Worker节点上。

当申请到资源之后,Driver应该直接分发任务到各个Executor,因此,在程序运行期间,Driver是必须要保护活的。

今日份spark(三)

另外一个心得是:HDFS作为分布式文件系统,YARN作为分布式资源调度器,配合分布式计算框架无论是MR还是Spark,构成的就是一个分布式的VM,这样的架构跟之前设想的完美契合!

相关文章

  • 今日份spark(三)

    ClusterManager负责资源管理,比如YARN。 Driver负责向资源管理器申请资源,资源也就是Work...

  • 今日份Spark(一)

    和MR的对比 Spark相对于MapReduce在2类场景下会显著增强: 交互式的场景 内存迭代计算型的场景。 原...

  • 今日份Spark(二)

    一个Application对应至少1个Job。一个Job对应至少1个Stage。一个Stage对应至少1个Task...

  • 5W字总结Spark(一)(建议收藏)

    本文目录: 一、Spark 基础二、Spark Core三、Spark SQL四、Spark Streaming五...

  • 今日份生活(三)

    2020.6.12 星期五 阴天带着小雨 今天的我早早就醒了,为什么呢? 因为今天呢,是一个注定紧张的一天...

  • 今日份想法(三)

    1.生活让我别无他法,只能选择重头再来。 2.我害怕失败,也不敢直面挫折。对,的确是我心里脆弱,可是我从未得到认可...

  • Spark BlockManager

    BlockManager为Spark 存储block主要类,和HDFS类似点: 三份数据存储时,本机,本RACK,...

  • Spark集群搭建

    Spark分布式集群搭建 Spark版本选择 三大主要版本: 本次选择的版本: Spark依赖环境 Spark分布...

  • spark资料收集

    一、spark远程调试源代码 二、spark运行原理job、stage、task理解 三、spark任务依赖第三方jar

  • 今日份三问三答

    又不想直播了怎么办? 嗯,我要好好考虑一下这个问题。 问:为什么总是想放弃? 答:因为没有人守护陪伴呗。比如没人打...

网友评论

      本文标题:今日份spark(三)

      本文链接:https://www.haomeiwen.com/subject/bnnfaqtx.html