《分布式》专题

专题列表页

高性能、分布式系统设计

论文概要该论文是Spark团队在2018年发表的一篇基于Spark引擎之上新构建的一套Streaming api...[作者空间]

根据集群的生命周期、资源隔离方式和应用程序的main()方法执行位置(client或者JobManager)可以将...[作者空间]

Flink集群架构 Flink采用Master-Slave架构，其中JobManager作为集群Master节点，...[作者空间]

Trident是什么 Trident是Storm上的高层次抽象，它能够在提供高吞吐量的能力同时(每秒几百万消息)，...[作者空间]

Storm架构 Storm是一个分布式、可靠的实时计算系统。与Hadoop不同的是，它采用流式的消息处理方法，对于...[作者空间]

Spark简介什么是Spark？ Apache Spark是由加州伯克利分校AMP实验室开发的通用大数据处理框架...[作者空间]

基础环境 Java8或更高版本 Linux、Mac OSX或者其它类Unix操作系统，目前不支持Windows操系...[作者空间]

我们知道Druid能够同时提供对大数据集的实时摄入和高效复杂查询的性能，主要原因就是它独到的架构设计和基于Data...[作者空间]

Druid介绍 Druid是什么 Druid("德鲁伊")是由广告公司MetaMarkets开源的实时大数据分析引...[作者空间]

OLTP和OlAP 数据处理大致可分为两大类：联机事务处理OLTP(On-Line Transaction Pro...[作者空间]

kafka客户端 Kafka除了提供内置Java客户端外，还提供了二进制连接协议，即向Kafka网络端口发送适当的...[作者空间]

Kakfa介绍 Kafka是什么 Kafka最初是LinkedIn的内部内部基础设施系统。它被认为是一个流平台，在...[作者空间]

[toc] Consul介绍使服务发现和配置变得简单(1.2版本后换了口号：网格服务变的更简单，Service ...[作者空间]