Flink使用HiveCatalog可以通过批或者流的方式来处理Hive中的表。这就意味着Flink既可以作为Hi...[作者空间]
需求背景 我们生产常有将实时与Hive维表join来丰富数据的需求、Hive表是分区表、上周Flink 1.12发...[作者空间]
目录 一、CDH介绍 二、CDH6.1.0安装前环境的部署 三、CDH6.1.0安装 四、CDH6.1.0的初始化...[作者空间]
问题描述 impala在查询一些大表的时候,查询特别慢 优化前 寻路 按SQL调优的套路来,explain一下发现...[作者空间]
合并小文件 总结 1.在设置了NUM_NODES=1后,如果合并的数据量超过Impala默认的Parquet Bl...[作者空间]
前期准备 1.下载Impala JDBC驱动包 https://downloads.cloudera.com/co...[作者空间]
很多企业CDH是没有集成kerberos,原因是kerberos部署后,服务使用起来变复杂,大部分只配置了sent...[作者空间]
序言 纪录下Hadoop集群的搭建过程及途中踩过的坑,希望能对正在学习的同学有个帮助,少走点弯路~ PS:为了便于...[作者空间]