美文网首页spark
1.Spark编程模型

1.Spark编程模型

作者: wangyizhen | 来源:发表于2016-11-29 20:21 被阅读120次

背景:诞生于伯克利大学AMPLab的Spark是当今大数据领域最活跃、最热门、最高效的大数据通用平台,是Apache软件基金会所有开源项目中三大顶级开源项目之一。

1.1 Spark:一体化、多元化的告诉大数据通用计算平台和库

基于RDD,Spark成功构架起了一体化、多元化的大数据处理体系,在“One Stack to rule them all”思想的引领下,Spark成功使用Spark SQL、Spark Streaming、MLlib、GraphX近乎完美的解决了大数据中的Batch Processing、Streaming processing、Ad-hoc Qurey等三大核心问题。更为优雅的是,在Spark中,Spark SQL、Spark streaming、MLlib、GraphX四大子框架和库之间可以无缝共享数据和操作。

Spark的官网定义:Spark是一个通用的大规模数据快速处理引擎。

1.2 Spark大数据处理框架

1.2.1 Spark速度为何如此之快

1.统一的RDD抽象和操作

Spark作为一个通用的大数据计算平台,基于“One Stack to rule them all”的理念成功成为一体化、多元化的大数据处理平台,轻松应对大数据处理中的实时流计算、SQL交互式查询、机器学习和图计算等。

2.基于内存的迭代式计算

3.DAG

4.出色的容错机制

1.2.2 RDD:分布式函数式编程

相关文章

  • 1.Spark编程模型

    背景:诞生于伯克利大学AMPLab的Spark是当今大数据领域最活跃、最热门、最高效的大数据通用平台,是Apach...

  • 【Spark学习笔记】初识spark

    1.Spark简介 快速且通用的集群计算平台 1.1.快速性: Spark扩充了流行的mapreduce计算模型 ...

  • Spark基本工作原理和RDD特性

    1.spark的基本工作原理 1. 迭代式计算: Spark与MapReduce最大的不用在于其迭代式计算模型: ...

  • ApacheBeam编程模型

    Beam 的编程模型 那事不宜迟,我们来看看 Beam 的编程模型到底指的是什么? 简单来说,Beam 的编程模型...

  • hadoop

    mapreduce 的编程模型 数据编程模型: input--split--map--(combine,parti...

  • 1.spark读取数据与scala编程

    以下是idea中用到的maven仓库版本说明:spark 2.3.1scala 2.11hadoop 3.1.1

  • golang的线程模型——GMP模型

    常见的线程模型 单线程服务器编程模型:Redis、Node.、JavaScript 多线程服务器编程模型:并发多个...

  • Spring 注解编程模型

    (Spring注解编程模型这篇博文,转译自Spring注解编程模型.) 说明 本文档与Spring Framewo...

  • Spider基础之网络编程

    学习自刘大拿的Python课程 网络编程 网络编程 网络协议: 一套规则 网络模型:七层模型-理论模型:任务分块,...

  • 为什么要使用异步 PHP

    同步编程与异步编程的区别 在讨论异步 PHP 的优点之前,让我们快速回顾一下同步编程模型和异步编程模型之间的区别。...

网友评论

    本文标题:1.Spark编程模型

    本文链接:https://www.haomeiwen.com/subject/ytaapttx.html