今天来聊下Hadoop和HDFS。 1、Hadoop介绍 1.1、Hadoop是什么? Hadoop是一个由Apa...[作者空间]
一、背景 事实表通常存储在kafka中,维表通常存储在外部设备中(比如MySQL,HBase)。对于每条流式数据,...[作者空间]
上一篇 <<<柔性事务和刚性事务(ACID)[https://www.jianshu.com/p/6ccd59dc...[作者空间]
概述 Zookeeper是一个开源的分布式的,为分布式应用提供协调服务的Apache项目。 特点 Zookeepe...[作者空间]
1.平台问题 Apachehadoop[http://lib.csdn.net/base/hadoop]:Apac...[作者空间]
转载:原文地址 实时数仓建设目的 解决传统数仓的问题 实时数仓是一个很容易让人产生混淆的概念。实时数仓本身似乎和把...[作者空间]
Impala的操作命令 一.Impala的外部shell 选项描述-h, --help显示帮助信息-v or --...[作者空间]
基本查询 全表数据查询: 特定列查询: 语句大小写不敏感,可以全写在一行,也可以写在多行。 关键字不能被缩写,也不...[作者空间]
1.1 Hadoop源码编译支持Snappy压缩 1.1.1 资源准备 1.CentOS联网 配置CentOS能连...[作者空间]
hiveserver2服务 前面都是使用Hive的命令行客户端,此处记录一下hiveserver2服务启动使用的方...[作者空间]
一 HDFS概念 1概念 HDFS,它是一个文件系统,全称:Hadoop Distributed File Sys...[作者空间]
order by 语法操作 order by 是进行全局排序,在整个作业执行过程中,只产生一个 reducer,在...[作者空间]
实现步骤 1.首先保证电脑上linux系统或虚拟机配置JDK和Hadoop(此处属于hadoop的安装知识,此处不...[作者空间]
原理的角度出发,map reduce其实就是二分查找的一个逆过程,不过因为计算节点有限,所以map和reduce前...[作者空间]
Hive是Hadoop的子项目,它提供了对数据的结构化管理和类SQL语言的查询功能。SQL的交互方式极大程度地降低...[作者空间]
上一篇:097-BigData-25Hive函数压缩存储格式 九、企业级调优 9.1 Fetch抓取Fetch抓取...[作者空间]
上一篇:095-BigData-23Hive分区及DML操作 六、查询 官方资料之查询(select) 6.1 基...[作者空间]
上一篇:094-BigData-22Hive数据类型及操作 一、Hive分区 分区表实际上就是对应一个HDFS文件...[作者空间]
Linux第9课:FI——华为版hadoop平台 时间 2019-03-13 下午3:30 主讲杨成林、杨震 地点...[作者空间]
Impala能够对HDFS,Hbase中的数据,提供快速的,交互的SQL查询,除了和Hive一样使用统计的存储平台...[作者空间]