美文网首页
工作流调度器azkaban(二) 使用

工作流调度器azkaban(二) 使用

作者: 做个合格的大厂程序员 | 来源:发表于2020-06-26 15:58 被阅读0次

Command类型单一job示例

step 1

创建job描述文件,创建文本文件,更改名称为mycommand.job注意后缀.txt一定不要带上,保存为格式为UFT-8 without bom,内容如下:

type=command
command=echo 'hello world'

step 2

将job资源文件打包成zip文件

image

step 3

创建project并上传压缩包,通过azkaban的web管理平台创建project并上传job压缩包。首先创建project:

image image image

Command类型多job工作流flow

step 1

创建有依赖关系的多个job描述

第一个job:foo.job

type=command
command=echo 'foo'

第二个job:bar.job依赖foo.job

type=command
dependencies=foo
command=echo 'bar'

step 2

将所有job资源文件打到一个zip包中

image

step 3

在azkaban的web管理界面创建工程并上传zip包(同单节点一致)

step 4

启动工作流flow (同单节点一致)

HDFS操作任务

step 1

创建job描述文件fs.job

type=command
command=/export/servers/hadoop-2.6.0-cdh5.14.0/bin/hadoop fs -mkdir /azkaban

step 2

将job资源文件打包成zip文件

image

step 3

通过azkaban的web管理平台创建project并上传job压缩包

step 4

启动执行该job

MAPREDUCE任务

step 1

创建job描述文件,及mr程序jar包(示例中直接使用hadoop自带的example jar)

type=command
command=/export/servers/hadoop-2.6.0-cdh5.14.0/bin/hadoop jar hadoop-mapreduce-examples-2.6.0-cdh5.14.0.jar pi 3 5

step 2

将所有job资源文件打到一个zip包中

image

step 3

在azkaban的web管理界面创建工程并上传zip包

step 4

启动job

HIVE脚本任务

step 1

创建job描述文件和hive脚本

create database if not exists azhive;
use azhive;
create table if not exists aztest(id string,name string) row format delimited fields terminated by '\t';

step 2

Job描述文件:hive.job

type=command
command=/export/servers/hive-1.1.0-cdh5.14.0/bin/hive -f 'hive.sql'

ps:hive -f 执行固定的脚本任务

step 3

将所有job资源文件打到一个zip包中

image

step 4

在azkaban的web管理界面创建工程并上传zip包

step 5

执行脚本

azkaban的定时任务

使用azkaban的scheduler功能可以实现对我们的作业任务进行定时调度功能

image image

*/1 * ? * * 每分钟执行一次定时调度任务
0 1 ? * * 每天晚上凌晨一点钟执行这个任务
0 */2 ? * * 每隔两个小时定时执行这个任务
30 21 ? * * 每天晚上九点半定时执行这个任务

具体可以参考corn表达式生成网站

网站地址

相关文章

  • Azkaban安装

    Azkaban安装 1 Azkaban介绍 Azkaban是由Linkedin开源的一个批量工作流任务调度器。用于...

  • Azkaban工作流引擎和Flume数据采集

    .Azkaban工作流引擎和Flume数据采集 Azkaban介绍 一、Azkaban简介 为什么需要工作流调度系...

  • 工作流调度器azkaban(二) 使用

    Command类型单一job示例 step 1 创建job描述文件,创建文本文件,更改名称为mycommand.j...

  • 大数据技术之azkaban

    一、azkaban介绍 Azkaban是由Linkedin开源的一个批处理工作流任务调度器。用于在一个工作流内以一...

  • Azkaban任务上传,设置依赖和调度

    摘要:azkaban,任务调度 Azkaban简介 Azkaban是由Linkedin公司推出的一个批量工作流任务...

  • 2018-08-21

    1. Azkaban是什么? Azkaban是由Linkedin公司推出的一个批量工作流任务调度器,主要用于在一个...

  • 工作流调度器azkaban

    一、准备 安装VMware15虚拟化软件 安装CentOS 7虚拟机3个 安装3节点的hadoop-2.6.0-c...

  • 删除azkaban的执行历史

    azkaban是一款工作流调度工具,由Linkedin开发并开源给社区。 azkaban保留了task,flow的...

  • Azkaban

    目录一 概述1.1 为什么需要工作流调度系统1.2 Azkaban的适用场景1.3 什么是azkaban1.4 A...

  • Azkaban 3.0 安装 - 单机模式

    Azkaban是由Linkedin开源的一个批量工作流任务调度器。用于在一个工作流内以一个特定的顺序运行一组工作和...

网友评论

      本文标题:工作流调度器azkaban(二) 使用

      本文链接:https://www.haomeiwen.com/subject/adrufktx.html