Spark源码解析:DStream

作者: 2453cf172ab4 | 来源:发表于2017-05-25 23:18 被阅读1032次

0x00 前言

本篇是Spark源码解析的第二篇,主要通过源码分析Spark Streaming设计中最重要的一个概念——DStream。

本篇主要来分析Spark Streaming中的Dstream,重要性不必多讲,明白了Spark这个几个数据结构,容易对Spark有一个整体的把握。

和RDD那篇文章类似,虽说是分析Dstream,但是整篇文章会围绕着一个具体的例子来展开。算是对Spark Streaming源码的一个概览。

文章结构

  • Spark Streaming的一些概念,主要和Dstream相关
  • Dstream的整体设计
  • 通过一个具体例子深入讲解

0x01 概念

什么是Spark Streaming

Scalable, high-throughput, fault-tolerant stream processing of live data streams!

一个实时系统,或者说是准实时系统。详细不再描述。

提一点就是,Streaming 的任务最后都会转化为Spark任务,由Spark引擎来执行。

微信公众号

相关文章

网友评论

    本文标题:Spark源码解析:DStream

    本文链接:https://www.haomeiwen.com/subject/qaqtfxtx.html