美文网首页
tez on yarn配置任务优先级

tez on yarn配置任务优先级

作者: JX907 | 来源:发表于2022-05-24 18:40 被阅读0次

一、现状
当前yarn上任务只有队列间的资源抢占,队列内缺乏任务优先级配置,因此所有任务的优先级都是默认的,默认优先级的配置通过此参数配置yarn.scheduler.capacity.root.<leaf-queue-path>.default-application-priority,默认值为0;此外hive on tez的任务在maper阶段会尽可能申请所需的最大资源来运行,极端情况下如果存在一个有问题的任务一直占用集群所有资源会导致其他任务都无法运行,因此需要一种方式能够让重要的任务尽可能的抢占到资源。
当前yarn的队列资源调度使用的是capacity容量调度器,该调度器支持队列间和队列内抢占的,当前的集群配置也是启用了两类抢占方式的,但队列内的抢占依赖任务的优先级,从网上找到的内容是需要在任务运行前配置SET mapreduce.job.priority=50,尝试过没有效果,造成无效有两个原因:
一是最大优先级参数(yarn.cluster.max-application-priority)没有配置,hadoop官网可以查到该值得默认值是0,设置为大于最大优先级的值时均按最大优先级设置;
二是tez中设置任务优先级的参数确实不是mapreduce.job.priority,通过查看tez源码发现对应的参数应该为tez.am.application.priority,该值越大代表获取资源的优先级越高。


image.png

二、集群配置
增加最大优先级参数配置yarn.cluster.max-application-priority=100;意味着在配置任务优先级tez.am.application.priority时值不能大于该值。

三、使用方式
在hive sql运行前配置set tez.am.application.priority=【0到100之间的数字】
验证方式: 在yarn页面中找到对应任务,查看Application Priority值是否为配置的值。


image.png

相关文章

  • tez on yarn配置任务优先级

    一、现状当前yarn上任务只有队列间的资源抢占,队列内缺乏任务优先级配置,因此所有任务的优先级都是默认的,默认优先...

  • Hadoop2.0 | Tez配置优化

    配置优化 Tez优化机制 YARN当前存在的问题每个作业启用一个Application-Master,应用程序延迟...

  • Spark-on-yarn遇到的Java crash问题

    问题描述 配置好Hadoop集群(包括hdfs和yarn),配置好spark-on-yarn,提交任务后发现con...

  • 简单的介绍Hadoop的基本结构和其组件功能

    HDFS:分布式文件系统MapReduce:分布式并行编程模型YARN:资源管理和调度器Tez:运行在YARN之上...

  • Yarn与Mesos的对比

    Mesos和YARN的简介 Mesos和YARN之间的主要区别围绕着优先级的设计以及调度任务的方式。Mesos于2...

  • yarn cgrop file leak

    问题描述:工作需要,使用yarn cgroup进行cpu隔离,防止某些cpu密集型任务影响其他任务,配置完yarn...

  • `spark.yarn.jar`和`spark.yarn.arc

    启动Spark任务时,在没有配置spark.yarn.archive或者spark.yarn.jars时, 会看到...

  • Hive+LLap+Tez问题

    问题描述 使用Hive+LLap+Tez的方式执行hql,配置好hive.execution.engine=tez...

  • spark-submit yarn错误解决

    Spark 集群提交模式 Spark一般常用三种提交模式,local、独立集群、yarn 1.提交配置优先级 应用...

  • YARN配置

    ##YARN上运行MapReduce程序 配置yarn上运行 1.配置yarn-env.sh(配置JAVA_HOM...

网友评论

      本文标题:tez on yarn配置任务优先级

      本文链接:https://www.haomeiwen.com/subject/ndfsprtx.html