美文网首页
Hive数据迁移

Hive数据迁移

作者: Moon_魔宽 | 来源:发表于2019-04-22 16:53 被阅读0次

版权声明:本文为博主原创文章,未经博主允许不得转载。https://www.jianshu.com/p/5e0b1765163d

【迁移背景】

本次需要将老集群的hive数据(共30多张表)迁移至新集群中。

老集群版本为CDH5.13,未启用kerberos;

新集群版本为CDH5.14,启用了kerberos。

由于cloudera官方文档说明,在5.x的版本不支持从未启用kerberos的集群与启用了kerberos的集群之间的数据复制。因此无法通过bdr方式进行数据同步。于是采用手工方式进行测试验证。

第一步,老集群数据导致,以老集群test库下的两张表为例

在老集群hive中执行导出命令,将hive数据导出到hdfs一个目录下,export table tab1 to '/tmp/hive-export/test/tab1'

以上默认是将test.tab1和test.tab2两张表的所有数据都导出到hdfs

查看hdfs上的文件

2、在新的集群上执行distcp(一定要在新集群执行,因为开启了kerberos)

[root@spbdhbdh55 ~]# hadoop distcp-overwrite hdfs19.126.68.318020tmphive-export hdfs19.121.1.268020tmphive-export

拷贝结束,查看新集群hdfs上已有文件生成:

登陆hive查看此时还没有test库:

新建test库:

将数据恢复到hive中:

import table test.tab1 from 'tmp/hive-export/test/tab1';

查看表:

执行一个查询:

相关文章

  • hdfs文件迁移

    hadoop跨集群之间迁移HDFS数据 不同hadoop集群之间迁移hive数据 hadoop跨集群之间迁移hiv...

  • 一篇文章教你自建hadoop集群迁移到EMR

    自建集群要迁移到EMR集群,往往需要迁移已有数据。本文主要介绍hdfs数据和hive meta数据如何迁移。 前置...

  • hive数据迁移

    hive的数据迁移一般需要考虑多个部分。1.元数据怎么迁移2.数据怎么迁移3.迁移过后元数据和数据怎么产生关联 1...

  • Hive数据迁移

    版权声明:本文为博主原创文章,未经博主允许不得转载。https://www.jianshu.com/p/5e0b1...

  • hive的这些事(一)——hive数据迁移

    比如需要把生产的hive集群数据迁移到另一个集群,hive提供了2个命令工具,可以实现表的批量迁移。 [expor...

  • hive数据迁移实例

    公司要完成hive数据迁移1.创建hdfs临时文件夹来保存数据 生成数据导出脚本执行以下的命令,生成数据导出的脚本...

  • HIVE数据迁移2

    版权声明:本文为博主原创文章,未经博主允许不得转载。https://www.jianshu.com/p/c1cb1...

  • HIVE数据迁移3

    版权声明:本文为博主原创文章,未经博主允许不得转载。https://www.jianshu.com/p/77c1c...

  • 那些年 CDH 5.13 所踩过的坑

    默认情况下hive访问不到子目录下面数据的问题 我们通过把hdp的数据迁移到了cdh,然后发现一些hive表存储的...

  • HDFS源文件迁移

    在工作中难免会遇到需要迁移大数据库,这时候就涉及到迁移hive等HDFS文件 解决方案: 采用hadoop dis...

网友评论

      本文标题:Hive数据迁移

      本文链接:https://www.haomeiwen.com/subject/qbkugqtx.html