美文网首页
Druid实时数据摄入参考

Druid实时数据摄入参考

作者: liuzx32 | 来源:发表于2018-12-07 17:19 被阅读21次

1. 概述

Druid的数据摄入主要包括两大类:实时数据摄入和离线数据摄入

1.1. 实时输入摄入:包括Pull, Push两种

- Pull: 需要启动一个RealtimeNode节点,通过不同的Firehose摄取不同种类的数据源。
- Push: 需要启动Tranquility或是Kafka索引服务。通过HTTP调用的方式进行数据摄入。

1.2. 离线数据摄入:可以通过Realtime节点摄入,也可以通过索引节点启动任务摄取。


本文演示环节主要基于上一章部署的集群来进行

2. 实时数据摄入

2.1 Pull模式

由于Realtime Node 没有提供高可用,可伸缩等特性,对于比较重要的场景推荐使用 Tranquility Server  或是Tranquility Kafka索引服务。

2.2 Push模式

Indexing service在前文已经介绍过了,Tranquility 是一个Scala库,它通过索引服务实现数据实时的摄取。它之所以存在,是因为Indexing service API属于低层面的。Tranquility是对索引服务进行抽象封装, 对使用者屏蔽了 创建任务,处理分区、复制、服务发现和shema rollover等环节。

#通过Tranquility 的数据摄入,可以分为两种方式

- Tranquility Server:发送方可以通过Tranquility Server 提供的HTTP接口,向Druid发送数据。
- Tranquility Kafka:发送发可以先将数据发送到Kafka,Tranquility Kafka会根据配置从Kafka获取数据,并写到Druid中。

#启动Tranquility Server

- bin/tranquility server -configFile conf/tranquility/server.json

#启动Tranquility Kafka

- bin/tranquility kafa -configFile conf/tranquility/kafka.json

#

相关文章

  • Druid实时数据摄入参考

    1. 概述 Druid的数据摄入主要包括两大类:实时数据摄入和离线数据摄入 1.1. 实时输入摄入:包括Pull,...

  • Druid.io大查询分析思路

    Druid.io 是CPU和IO双密集型的大数据组件,因为Druid架构中无论是处理实时数据摄入的peon进程还是...

  • Druid 实时摄入方式

    Realtime Node Realtime Node 可以直接配置Firehose从Kafka,RabbitMQ...

  • Apache Druid 命令执行漏洞复现(CVE-2021-2

    0x00简介 Druid 是一个分布式的、支持实时多维 OLAP 分析的数据处理系统。它既支持高速的数据实时摄入处...

  • Druid数据摄入规范

    本篇文章主要是向读者介绍如何制定Druid摄入数据的规范,指出开发过程中需要注意的关键事项和规则,方便刚接触Dru...

  • Druid基础介绍和系统架构

    Druid介绍 Druid是什么 Druid("德鲁伊")是由广告公司MetaMarkets开源的实时大数据分析引...

  • Druid高效架构

    我们知道Druid能够同时提供对大数据集的实时摄入和高效复杂查询的性能,主要原因就是它独到的架构设计和基于Data...

  • Druid高效架构

    我们知道Druid能够同时提供对大数据集的实时摄入和高效复杂查询的性能,主要原因就是它独到的架构设计和基于Data...

  • 实时OLAP分析利器Druid介绍

    文章目录 前言 Druid 主要特性 基础概念-- 数据格式-- 数据摄入-- 数据存储-- 数据查询-- 查询类...

  • druid

    Druid.io(以下简称Druid)是面向海量数据的、用于实时查询与分析的OLAP存储系统。Druid的四大关键...

网友评论

      本文标题:Druid实时数据摄入参考

      本文链接:https://www.haomeiwen.com/subject/ssqxhqtx.html