大数据凉了？No，流式计算浪潮才刚刚开始！

作者: YDDMAX_Y | 来源:发表于2019-08-08 10:55 被阅读0次

大数据凉了？No，流式计算浪潮才刚刚开始！
(二十二)大数据学习之流式计算
200、Spark 2.0之Structured Streami
Storm核心组件、编程模型
Storm核心组件、编程模型
Storm核心组件、编程模型
Storm核心组件、编程模型
找寻数据的统治者：Flink与Spark比较，你更喜欢哪个
流式计算
Kafka集群部署与shell命令行操作

https://cloud.tencent.com/developer/article/1357109

MapReduce：可扩展性和简单性通过在强大且可扩展的执行引擎之上提供一组简单的数据处理抽象，MapReduce 让我们的数据工程师专注于他们的数据处理需求的业务逻辑，而不是去构建能够适应在一大堆普通商用服务器上的大规模分布式处理程序。
Hadoop：开源生态系统通过构建一个关于 MapReduce 的开源平台，无意中创建了一个蓬勃发展的生态系统，其影响力所及的范围远远超出了其最初 Hadoop 的范围，每年有大量的创新性想法在 Hadoop 社区蓬勃发展。
Flume：管道及优化通过将逻辑流水线操作的高级概念与智能优化器相结合，Flume 可以编写简洁且可维护的 * Pipeline，其功能突破了 MapReduce 的 Map→Shuffle→Reduce 的限制，而不会牺牲性能。
Storm：弱一致性，低延迟通过牺牲结果的正确性以减少延迟，Storm 为大众带来了流计算，并开创了 Lambda 架构的时代，其中弱一致的流处理引擎与强大一致的批处理系统一起运行，以实现真正的业务目标低延迟，最终一致型的结果。
Spark: 强一致性通过利用强大一致的批处理引擎的重复运行来提供无界数据集的连续处理，Spark Streaming 证明至少对于有序数据集的情况，可以同时具有正确性和低延迟结果。
MillWheel：乱序处理通过将强一致性、精确一次处理与用于推测时间的工具（如水印和定时器）相结合，MillWheel 做到了无序数据进行准确的流式处理。
Kafka: 持久化的流式存储，流和表对偶性通过将持久化数据日志的概念应用于流传输问题，Kafka 支持了流式数据可重放功能。通过对流和表理论的概念进行推广，阐明数据处理的概念基础。
Cloud Dataflow：统一批流处理引擎通过将 MillWheel 的无序流式处理与高阶抽象、自动优化的 Flume 相结合，Cloud Dataflow 为批流数据处理提供了统一模型，并且灵活地平衡正确性、计算延迟、成本的关系。
Flink：开源流处理创新者通过快速将无序流式数据处理的强大功能带到开源世界，并将其与分布式快照及保存点功能等自身创新相结合，Flink 提高了开源流处理的业界标准并引领了当前流式处理创新趋势。
Beam: 可移植性通过提供整合行业最佳创意的强大抽象层，Beam 提供了一个可移植 API 抽象，其定位为与 SQL 提供的声明性通用语言等效的程序接口，同时也鼓励在整个行业中推进创新。

网友评论

本文标题：大数据凉了？No，流式计算浪潮才刚刚开始！

本文链接：https://www.haomeiwen.com/subject/ihitjctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

大数据凉了？No，流式计算浪潮才刚刚开始！

相关文章

大数据凉了？No，流式计算浪潮才刚刚开始！

(二十二)大数据学习之流式计算

200、Spark 2.0之Structured Streami

Storm核心组件、编程模型

Storm核心组件、编程模型

Storm核心组件、编程模型

Storm核心组件、编程模型

找寻数据的统治者：Flink与Spark比较，你更喜欢哪个

流式计算

Kafka集群部署与shell命令行操作

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读