美文网首页
Flume入门

Flume入门

作者: 及未来 | 来源:发表于2020-04-15 13:52 被阅读0次

Flume简介

    Flume is a distributed, reliable, and available service for efficiently collecting, aggregating, and moving large amounts of log data. It has a simple and flexible architecture based on streaming data flows. It is robust and fault tolerant with tunable reliability mechanisms and many failover and recovery mechanisms. It uses a simple extensible data model that allows for online analytic application.

    简单说,Flume就是一个分布式采集日志文件的服务

个人理解

    每一个技术(工具)诞生都是为了解决一个痛点。Flume的诞生是为了实现数据的自动化导入。而且Flume拥有分布式,可靠,对HDFS良好支持的特性,所以Flume得到广泛的使用。Flume的作用与地铁类似,可以类比地铁,来了解Flume各核心组件的作用。

Flume核心组件

  1. Sourse 数据源
  2. Channel 频道(管道)
  3. Sink 数据输出源

安装使用

  • 1.准备 java 运行环境
  • 2.下载安装 Flume
    进入Flume官网链接下载
  • 3.解压
tar -zxvf apache-flume-1.9.0-bin.tar.gz flume
  • 4.编写配置文件
#example.conf(flume目录下存在)

## 定义Agent的3个组件变量
a1.sources = r1
a1.sinks = k1
a1.channels = c1

## 设置Source
a1.sources.r1.type = netcat
a1.sources.r1.bind = localhost
a1.sources.r1.port = 44444

## 设置Sink
a1.sinks.k1.type = logger

## 设置Channel
a1.channels.c1.type = memory
a1.channels.c1.capacity = 1000
a1.channels.c1.transactionCapacity = 100

## 连接3个组件
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1
  • 5.启动 Agent 采集数据
/opt/module/flume/bin/flume-ng agent --conf conf --conf-file example.conf --name a1
  • 6.对指定端口发送数据
#连接该端口,并发送数据
telnet localhost 44444

如果能出现这些Event的日志打印,就表示这个入门小Demo测试成功啦

Flume控制台打印Event日志

Flume 组件间关系

比喻 Flume 的数据抽取就像是地铁

  • 1.总体上,Flume是在管道中传输数据。而地铁在管道中运输人
  • 2.Flume-Source 作为数据源,也就是地铁的入站口,有人(数据)输入;
  • 3.Flume-Channel 作为管道,有运输,缓冲的作用。地铁的的隧道也有缓冲的功能——如果前面的地铁还没下完人,下一班地铁就要隧道中临时停车,直到上班地铁的人下车完毕;
  • 4.Flume-Sink 作为输出源,在地铁上也有下车站点;
Flume 地铁
Source 入站口
Channel 隧道
Sink 出站口

如果喜欢这篇文章,帮忙点个赞哦,谢谢!
👇👇👇

相关文章

  • 尚硅谷大数据技术之Flume

    第2章 快速入门 2.1 Flume安装地址 1) Flume官网地址 http://flume.apache....

  • 【Nginx+Flume实现日志打点分析】

    安装nginx(略) 修改nginx.conf然后 nginx -s reload Flume入门 Flume官网...

  • Flume入门

    flume是分布式的日志收集系统,它将各个服务器中的数据收集起来并送到指定的地方去,可以是文件、可以是hdfs。 ...

  • Flume 入门

    一:Flume是什么: 二:特点: 三:Flume版本介绍 四:Flume NG基本架构 五:Flume NG核心...

  • Flume入门

    一、安装 1、必备条件 因为要把日志上传到hdfs上,所以需要以下hadoop依赖包: commons-confi...

  • Flume 入门

    1Flume概述 1.1 定义 Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚...

  • Flume 入门

    Flume 概述 Flume 官网 Flume 是一个分布式的,高可靠的,高可用的服务去高效的收集,聚合并移动大量...

  • Flume入门

    Flume简介     Flume is a distributed, reliable, and availab...

  • Flume,一款超好用的大数据聚集组件

    Flume入门     Flume的文档介绍很多了,不过还是想写一写,发散一下思维,比你平时看到的多一些启发,工作...

  • flume入门案例

    flume简单介绍 官网的一句话:Flume is a distributed, reliable, and av...

网友评论

      本文标题:Flume入门

      本文链接:https://www.haomeiwen.com/subject/exrcvhtx.html