美文网首页
hive压缩

hive压缩

作者: 后知不觉1 | 来源:发表于2022-08-18 20:44 被阅读0次

hive支持的文件格式

  • hive版本 2.1.1
  • hadoop版本 2.7.3
         文件格式 理论压缩格式 当前集群支持情况 建表语句
textfile DEFLATE 支持 无法通过建表属性加载压缩格式,自动压缩。需要全局开启压缩,输出压缩格式或者在session中设置#hive配置开启压缩\nset hive.exec.compress.intermediate=true; set hive.exec.compress.output=true; #指定引擎压缩\nset mapreduce.map.output.compress=true;set mapreduce.output.fileoutputformat.compress=true;\nset mapreduce.output.fileoutputformat.compress.type=BLOCK;\n#指定压缩化类\nsetmapreduce.map.output.compress.codec=org.apache.hadoop.io.compress.BZip2Codec;\nset mapreduce.output.fileoutputformat.compress.codec = org.apache.hadoop.io.compress.BZip2Codec;\n
gzip 支持
bzip2 支持
orc none(不压缩) 支持 CREATE TABLE compress_orc_none (name string, age string,roles string,gender string,work string,regine string) STORED AS orc tblproperties ("orc.compress"="none");
ZLIB 支持,默认 CREATE TABLE compress_orc_zlib(name string, age string,roles string,gender string,work string,regine string) STORED AS orc tblproperties ("orc.compress"="ZLIB")
SNAPPY 支持 CREATE TABLE compress_orc_snappy(name string, age string,roles string,gender string,work string,regine string) STORED AS orc tblproperties ("orc.compress"="SNAPPY")
LZO 否,需配置 CREATE TABLE compress_orc_lzo(name string, age string,roles string,gender string,work string,regine string) STORED AS orc tblproperties ("orc.compress"="LZO")
parquet none(不压缩) 支持,默认 CREATE TABLE compress_parquet_snappy(name string, age string,roles string,gender string,work string,regine string) STORED AS PARQUET
SNAPPY 支持 CREATE TABLE compress_parquet_snappy(name string, age string,roles string,gender string,work string,regine string) STORED AS PARQUET tblproperties ("parquet.compression"="SNAPPY")
GZIP 支持 CREATE TABLE compress_parquet_gzip(name string, age string,roles string,gender string,work string,regine string) STORED AS PARQUET tblproperties ("parquet.compression"="gzip")
LZO 否,需配置 CREATE TABLE compress_parquet_snappy(name string, age string,roles string,gender string,work string,regine string) STORED AS PARQUET tblproperties ("parquet.compression"="lzo")

相关文章

  • HIVE调优

    一 .hive的压缩方案介绍 在hive中一般推荐使用压缩方式:1.1 ) SNAPPY 速度最快(最常用的压缩方...

  • Hive学习-高级版五(压缩和存储)

    hive的压缩本质上指的是MapReduce的压缩,因为hive其实就是MapReduce的高级语言版(SQL),...

  • Hive安装

    Hive 安装与配置 hive安装 下载压缩包 下载地址 解压压缩包 配置环境变量 /etc/profile 检查...

  • 大数据环境搭建-Hive

    hive压缩包解压 使用mysql存储元数据 创建 hive 账号 hive元数据库 账号授权 通过hive账号...

  • HIVE

    --------hive 数据仓库 hive底层执行引擎有 MapReduce Tez Spark 压缩 GZI...

  • HiVE 压缩

    1.开启Map输出阶段压缩(MR引擎) 开启map输出阶段压缩可以减少job中map和Reduce task间数据...

  • hive压缩

    hive支持的文件格式 hive版本 2.1.1 hadoop版本 2.7.3 文件格式理论压缩格式当前...

  • hive积累大全

    此篇内容:hive自定义函数UDF、UDTF,压缩存储方式,hive优化、hive实际编程SQL中的if表达式用法...

  • Hive2

    Hive的部署解压缩、重命名、设置环境变量在目录$HIVE_HOME/conf/下,执行命令mv hive-def...

  • Hive中常用的数据压缩snappy

    Hive的数据压缩 压缩格式: bzip2, gzip, lzo, snappy等压缩比:bzip2>gzip>l...

网友评论

      本文标题:hive压缩

      本文链接:https://www.haomeiwen.com/subject/tjxygrtx.html