汇集各种介绍spark技术的好文章。
构建PySpark环境 首先确保安装了python 2.7 ,强烈建议你使用Virtualenv方便python环...[作者空间]
前言 Spark 2.0 将流式计算也统一到DataFrame里去了,提出了Structured Streamin...[作者空间]
这篇文章只是为了阐述Spark Streaming 意外Crash掉后,如何保证Exactly Once Sema...[作者空间]