Spark-alpha-0.1源码解读

Spark-alpha-0.1源码解读

作者: 红袖者 | 来源:发表于2018-06-03 16:45 被阅读0次

Spark-alpha-0.1源码解读
AFN 3.0学习总结（最后的总结转载）
spring源码解读网上知识摘要
文章目录
Element分析（组件篇）——TableHeader
JDK源码-Object
【Java源码计划】LongAdder<rt.jar_ja
AFNetworking 3.0 源码解读（五）之 AFURLS
java多线程
AFURLSessionManager

Spark 0.1是spark开源的第一个版本，本文主要从组成类、如何触发执行、如何具体执行这几个方面进行分析。

主要组成类：

1.RDD，其中RDD主要包含两种类型的函数，一种供用户使用的算子，如map、reduce等；一种是任务真正执行时需要的函数，如split、iterator等；

RDD

2.Scheduler，调度器用来提交、终止生成的task任务；

Scheduler.png
3.Task，具体任务的执行逻辑被封装到一个线程中，提交给Executor执行；

Task.png

执行过程

举个简单的例子，其代码如下，然后我们对其执行逻辑进行分析，总结如下：生成RDD->行动操作触发RDD生成Tasks->通过scheduler提交Tasks给executor去真正执行；

val inputRDD = new HdfsTextFile("")
val res = inputRDD.map(f1).reduce(f2)；

1.从hdfs获取外部输入时，生成inputRDD，此RDD包含了文件路径和sparkContext；

HDFS输入

2.inputRDD调用map(f1)函数时，生成了MappedRDD，该rdd中包含前一个rdd，其splits为前一个rdd的splits；

生成MappedRDD

3.mappedRDD调用reduce(f2)操作时，会先对func进行闭包清除，接着splits.map(s => new ReduceTask(this, s, f))生成tasks；其中splits递归调用最终返回的splits是inputRDD对应的splits，然后将此rdd、闭包函数和一个inputSplit封装成一个reduceTask；

Reduce操作触发任务执行

4.封装的reduceTask其运行逻辑如下，rdd通过递归调用iterator(split)函数，最终inputRDD会先执行其map(f)函数，返回结果后回到上一层的子RDD中，子RDD再调用map(f)函数.......返回到当前RDD时获取了一个inputSplit的linear流水处理结果(针对每一行)，即前面的map(f)操作都执行完了，最后根据func的逻辑对前面的结果进行reduce聚合，获取一个reduceTask的计算结果；

ReduceTask的执行逻辑

5.rdd的reduce函数中再对多个reduceTask的返回结果，根据func逻辑进行聚合，最后获取怎个rdd的reduce结果；

6.reduce()利用sparkContext、sparkContext再利用scheduler、scheduler最后利用executor来真正执行tasks；

相关文章

Spark-alpha-0.1源码解读
Spark 0.1是spark开源的第一个版本，本文主要从组成类、如何触发执行、如何具体执行这几个方面进行分析。 ...
AFN 3.0学习总结（最后的总结转载）
AFNetworking 3.0 源码解读总结（干货）（上） AFNetworking 3.0 源码解读总结（...
spring源码解读网上知识摘要
spring 启动源码 spring 启动流程源码解读spring 启动注解加载类源码解读springxml 文件...
文章目录
Go 源码解读篇《Go源码解读篇》之常见数据结构(list) 《Go源码解读篇》之 Error 工作中知识总结 ...
Element分析（组件篇）——TableHeader
说明 table-header是表头组件，较为复杂，直接看源码解读。源码解读
JDK源码-Object
简介源码解读
【Java源码计划】LongAdder<rt.jar_ja
LongAdder 源码解读源码解读部分按照我得理解翻译和解读注解并添加相关的部分代码解读保持一个或者多个变量...
AFNetworking 3.0 源码解读（五）之 AFURLS
本篇是AFNetworking 3.0 源码解读的第五篇了。 AFNetworking 3.0 源码解读（一）之 ...
java多线程
java多线程线程类源码解读（2）-线程状态及常用方法线程类源码解读（3）-线程中断逐行分析AQS源码（1）...
AFURLSessionManager
本篇是AFNetworking 3.0源码解读的第五篇了。 AFNetworking 3.0 源码解读（一）之 A...

网友评论

本文标题：Spark-alpha-0.1源码解读

本文链接：https://www.haomeiwen.com/subject/blejsftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Spark-alpha-0.1源码解读|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！