美文网首页
流计算(一):流计算与其优势

流计算(一):流计算与其优势

作者: longLiveData | 来源:发表于2020-03-03 18:01 被阅读0次

流计算模式

传统的数据处理流程为:先收集数据,然后将数据放到数据库中,通过查询数据库中的数据,得到信息或进行下一步处理。
流计算方式:很好地对大规模流动数据在不断变化的运动过程中进行实时分析,捕捉到可能有用的信息,并把结果发送到下一计算节点。

代表流计算的有向无环图DAG:


流计算的优势

“流”能够非常自然描述业务执行的流程

“流”能够做任意细力度的划分,不管是大到整个产品线的各个服务模块,还是小到每个服务模块中的具体实现步骤。这是一种非常普遍的描述事情发生过程的模式。

流计算与异步

“流”的各个节点通过队列传递消息,不同节点的执行正好就是完全异步的。
由于有队列隔离,不同节点的执行完全不用考虑并发安全的问题。
“流”在内部执行时是异步和并行的,能最大限度提高资源使用效率,提高程序执行性能。

“流计算”与OOM问题

OOM, 全称Out Of Memory,指计算机运行过程中内存不够用的问题。

如果“流”的执行节点间使用的是阻塞队列,那么整个流的各个执行环节就天然地带有了反向压力能力,这样就避免了很多异步系统在高负载而又临时处理能力不足时造成OOM问题。

“流计算”与模块化

通过类似于Kafka这样消息中间件的隔离,可以非常清晰地定义模块和模块之间的边界。
这样的设计方式,符合高内聚、低耦合的设计模式。

相关文章

  • 流计算(一):流计算与其优势

    流计算模式 传统的数据处理流程为:先收集数据,然后将数据放到数据库中,通过查询数据库中的数据,得到信息或进行下一步...

  • Flink流式计算里的时间和watermark机制

    一 流计算对“批计算”的优势: “流计算”是相对于“批计算”来的,MapReduce,Spark底层的计算方式...

  • 阿里云流计算使用教程

    产品特点 相较于其他流计算产品,阿里云流计算提供一些极具竞争力的产品优势,用户可以充分利用阿里云流计算提供的产品优...

  • 流计算(四):流计算框架

    目前的开源流计算框架有许多,比如Apache Storm、Spark Streaming、Apache Samza...

  • 流计算

    什么是流计算: 在当下这个数据容量呈几何倍暴增的时代背景下,数据的价值在其产生之后,将随着时间的流逝,逐渐降低。因...

  • 流计算(二):流计算解决的问题

    流数据操作 流计算系统是针对数据流的转化或转移处理,所以实现流数据操作更加直观。 流数据操作的内容主要包括了三类:...

  • flink sql

    SQL的很多概念无法直接映射到流计算,这就是在流计算上定义SQL的难点。 为了在流计算上定义SQL,我们需要引入几...

  • 大数据开发:Flink框架的State状态简介

    Flink的出现,主攻流计算场景,提供有状态的流计算,尤其是在面对大规模实时流计算上,性能值得称赞。而Flink的...

  • Spark Streaming实时流处理-1.初识实时流处理

    目录 业务现状分析 实时流处理产生背景 实时流处理概述 离线计算与实时计算对比 实时流处理框架对比 实时流处理架构...

  • 阿里重磅开源 Blink:为什么我们等了这么久?

    今年,实时流计算技术开始步入主流,各大厂都在不遗余力地试用新的流计算框架,实时流计算引擎和 API 诸如 Spar...

网友评论

      本文标题:流计算(一):流计算与其优势

      本文链接:https://www.haomeiwen.com/subject/owohlhtx.html