Spark执行流程概要与DAG

Spark执行流程概要与DAG

作者: 不愿透露姓名的李某某 | 来源:发表于2019-07-23 11:38 被阅读0次

Spark执行流程概要与DAG
十年开发经验大牛分享Spark 以及 spark streami
spark的设计与运行原理
spark源码分析之Checkpoint的过程
Spark执行流程
Spark 执行流程
Spark Task 的执行流程④ - task 结果的处理
学习spark streaming源码之前的准备(一)
在spark-shell中进行wordcount的流程分析
Spark 推测执行(speculative)

一：RDD Objects

Spark执行代码块时会先构建DAG（有向无环图），描述了我们将要进行的操作

二：DAGScheduler

第二阶段为将一个DAG切分成多个stages，DAGScheduler切分的依据是Shuffle（宽依赖），在RDD执行过程中调用了很多算子，执行了很多RDD，并且还会调用Transformation，再执行很多的RDD。所以第二阶段会执行DAGScheduler切分stages装到TaskSet再发送给TaskScheduler，并且切分之后的stages他们的业务逻辑相同，只是数据不同而已

三：TaskScheduler

将上个阶段生成的多个Task调度到Worker的Executor中，意味着该Task要序列化，发送过去之后再反序列化，

四：Worker：

Executor接收Task，反序列化之后丢到线程池中执行

Spark执行流程图

DAG：（有向无环图）：数据执行过程，有方向，无闭环

描述多个RDD的转换关系，任务执行时，可以按照DAG的描述，执行真正的计算（数据被操作的一个过程）

DAG是有边界的：开始（通过SparkContext创建的RDD），结束（触发Action，调用 Run job 就是一个完整的DAG了）

一个Saprk Aoolication有多少个DAG：一到多个（触发一个Action就有一个DAG）

一个DAG可能产生多种不同类型和功能的Task，会有不同的阶段

一个RDD只是描述了任务执行过程中的一个环节，而DAG由一到多个RDD组成，描述了数据计算的所有环节（过程）

为什么要切分Stage？
一个复杂的业务逻辑（将多台机器上的具有相同属性的数据聚集到一台机器上：Shuffle）

如果有Shuffle，那么就意味着前面阶段产生结果后，才能执行下一个阶段（下一阶段的计算需要上个阶段的数据）

在同一个Stages中，会有多个算子，可以合并在一起，我们称其为pipeline（流水线：严格按照流程、顺序执行）

DAG流程图

Spak整体执行流程

相关文章

Spark执行流程概要与DAG
一：RDD Objects Spark执行代码块时会先构建DAG（有向无环图），描述了我们将要进行的操作二：DA...
十年开发经验大牛分享Spark 以及 spark streami
spark 生态及运行原理 Spark 特点运行速度快 => Spark拥有DAG执行引擎，支持在内存中对数据进...
spark的设计与运行原理
一、Spark简介 spark的特点(1) 运行速度快使用DAG执行引擎以支持循环数据流与内存计算 (2) 容易...
spark源码分析之Checkpoint的过程
概述 checkpoint 的机制保证了需要访问重复数据的应用 Spark 的DAG执行行图可能很庞大，task ...
Spark执行流程
1.当执行“spark -submit --master spark......”这个命令之后，在客户端中启动一个...
Spark 执行流程
今天做的一个梦，梦回大一结束，回高中复读高三，一年下来不思进取做题也是飘的，甚至看不懂题说的意思。高考后，没有上本...
Spark Task 的执行流程④ - task 结果的处理
本文为 Spark 2.0 源码分析笔记，其他版本可能稍有不同 Spark Task 的执行流程③ - 执行 ta...
学习spark streaming源码之前的准备(一)
请首先阅读以下几篇文章：了解什么是spark了解spark运行机制以及集群模式了解DAG以及RDD(一)了解DAG...
在spark-shell中进行wordcount的流程分析
spark-shell的启动流程： wordCount执行流程 val lines = sc.textFile("...
Spark 推测执行(speculative)
一speculative简介在spark作业运行中，一个spark作业会构成一个DAG调度图，一个DAG又切分成...

网友评论

本文标题：Spark执行流程概要与DAG

本文链接：https://www.haomeiwen.com/subject/nskolctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Spark执行流程概要与DAG|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！