美文网首页
Flink提交记录和运行日志删除脚本

Flink提交记录和运行日志删除脚本

作者: 清蒸三文鱼_ | 来源:发表于2025-05-21 17:29 被阅读0次

手动清理

#/bin/bash
export HADOOP_USER_NAME=hdfs
 
#获取正在运行的application
running_apps=`yarn application -list -appStates RUNNING|awk '{print $1}'|grep application`
#全部已提交的application
submit_apps=`hadoop fs -ls /user/hdfs/.flink/|awk '{print $NF}'|awk -F"/" '{print $NF}'|grep application`
 
cdh_log_exist=
if hadoop fs -test -e /tmp/logs/hdfs/logs;then
  cdh_log_exist=1
fi
 
#1-删除无效的flink运行依赖包和日志(针对CDH)
invalid_submit_apps=`comm -23 <(echo $submit_apps| tr ' ' '\n' | sort) <(echo $running_apps| tr ' ' '\n' | sort)`
for app_id in $invalid_submit_apps; do
  #删除flink提交包
  hadoop fs -rm -r -skipTrash /user/hdfs/.flink/$app_id
  #删除日志(CDH)
  if [ $cdh_log_exist ];then
    hadoop fs -rm -r -skipTrash /tmp/logs/hdfs/logs/$app_id
  fi
done
 
#2-删除无效的flink日志(针对开源的hadoop)
#格式1:/tmp/logs/hdfs/bucket-logs-tfile/5025/application_1732099242233_5025
#格式2:/tmp/logs/hdfs/bucket-logs-tfile/3592/application_1732099242233_13592
 
if hadoop fs -test -e /tmp/logs/hdfs/bucket-logs-tfile;then
  logs_apps=`hadoop fs -ls /tmp/logs/hdfs/bucket-logs-tfile/*/ | awk -F '/' '{print $NF}' | grep application`
  invalid_bucket_log_apps=`comm -23 <(echo $logs_apps| tr ' ' '\n' | sort) <(echo $running_apps| tr ' ' '\n' | sort)`
  for app_id in $invalid_bucket_log_apps; do
    hadoop fs -rm -r -skipTrash /tmp/logs/hdfs/bucket-logs-tfile/${app_id: -4}/$app_id
  done
fi

运行日志自动清理

  • 开启yarn的日志聚合, 设置合理的过期天数
  • 开启histrory server的进程, 用来清理历史数据


相关文章

  • Flink第三篇之Flink运行架构

    Flink运行架构. 任务提交流程. Flink任务提交后,Client向HDFS上传Flink的Jar包和配置,...

  • Git 删除某个历史记录

    我的历史提交记录是这样的,我要删除“首页侧边栏”这个提交记录。 步骤如下: 先找到要删除那次提交之前的提交记录,这...

  • 第四章.Flink 运行架构

    4.1 任务提交流程 Flink 任务提交后,Client 向 HDFS 上传 Flink 的 Jar 包和配置,...

  • SGE 作业调度系统

    1、sge提交脚本qsub 2、查询任务qstat 3、任务删除qdel 4、其他命令 5、bash脚本与Linu...

  • 2.3 Git 基础 - 查看提交记录

    提交记录git log 2.2 Git 基础 - 记录每次更新到仓库(删除和改名)2.4 Git 基础 - 撤销操...

  • git删除提交记录

    今天在公司git合并分支的时候不小心合并错了,原来应该将alpha1的内容合并到alpha2,结果将beta1的内...

  • 【Git Hook】之pre-push

    当提交记录中存在如下merge branch的记录时禁止push,防止污染提交记录 将如下shell脚本保存为pr...

  • Java日志框架研究及常见配置

    按照基本的定义,日志即是对程序运行过程中关键事件的记录;大体日志分为运行日志和开发日志,运行日志在业务层面记录一些...

  • Git常用命令

    Git常用命令 查看、添加、提交、删除、找回,重置修改文件 查看文件diff 查看提交记录 查看、切换、创建和删除...

  • slurm使用

    1、构建一个.slurm脚本 seri 2、提交作业 3、查看作业 4、删除作业

网友评论

      本文标题:Flink提交记录和运行日志删除脚本

      本文链接:https://www.haomeiwen.com/subject/gxitwjtx.html