美文网首页
Apache Beam

Apache Beam

作者: 丹之 | 来源:发表于2018-11-08 09:02 被阅读10次

Apache Beam基本架构

Apache Beam主要由Beam SDK和Beam Runner组成,Beam SDK定义了开发分布式数据处理任务业务逻辑的API接口,生成的的分布式数据处理任务Pipeline交给具体的Beam Runner执行引擎。Apache Beam目前支持的API接口是由Java语言实现的,Python版本的API正在开发之中。Apache Beam支持的底层执行引擎包括Apache Flink,Apache Spark以及Google Cloud Platform,此外Apache Storm,Apache Hadoop,Apache Gearpump等执行引擎的支持也在讨论或开发当中。其基本架构如下图所示:


https://zhuanlan.zhihu.com/p/23618169

相关文章

  • Apache Beam

    Apache Beam基本架构 Apache Beam主要由Beam SDK和Beam Runner组成,Beam...

  • 数据处理的内容、地点、时间和方式

    为了让您了解实际情况,我使用Apache Beam代码片段,并结合延时图来提供可视化的表示。Apache Beam...

  • Apache Beam介绍

    Apache Beam提供了统一的大数据编程抽象,提供了不同的执行引擎支持,比如Spark/Flink/Storm...

  • Apache Beam SQL

    Beam不仅支持java,python还支持SQL分析,非常类似于Spark SQL;Beam SQL 现在只支持...

  • Apache Beam 处理文件

    今天我们介绍了如何使用pipeline在 Apache Beam 中的文件中读取、写入数据,其中“Employee...

  • 让Apache Beam在GCP Cloud Dataflow上

    简介 在文章《Apache Beam入门及Java SDK开发初体验[https://www.pkslow.com...

  • Apache Beam入门学习一

    一、Beam编程基本概念 PCollection:数据集,可能是有界数据集(数据量有限)和无界数据集(数据量无限)...

  • apache beam 简介和安装

    1.Apache beam 是google和其合作伙伴开源的新的流式大数据分析模式,目前支持如下的引擎: 2.执行...

  • Apache Beam研究报告

    概述 本文不是一篇Beam的入门文档,不会介绍Beam的基本概念;而会主要探讨Beam的表达力,Beam的性能,以...

  • Apache Beam Pipeline设计.docx

    本文将帮助你理解如何设计pipeline。它包含关于如何确定pipeline结构、如何选择将哪些transform...

网友评论

      本文标题:Apache Beam

      本文链接:https://www.haomeiwen.com/subject/sfeixqtx.html