一、基本命令 二、关于表的操作 增删改 获取指定行 查询 hbase 中访问数据有两种基本的方式:按指定 rowk...[作者空间]
集群前准备jdk安装省略zookeeper安装省略Hadoop集群安装省略如果记不起来可查看前面文章链接:http...[作者空间]
一、HBase基本概念HBase-webTable1.RowKey(行键)Row Key是用来检索记录的主键。访问...[作者空间]
HBase是一个构建在Hadoop文件系统之上的面向列的数据库管理系统。Hadoop存储限制在于,Hadoop可以...[作者空间]
Flink诞生于柏林工业大学,原名StratoSphere。Flink是跟Storm一样的,都是一个流处理框架。目...[作者空间]
一、整合HDFS 新增hdfs的pom包 修改前面讲解的wordCount的示例 HDFS存储 二、整合HBase...[作者空间]
一、集群安装 链接:https://pan.baidu.com/s/1SUfYk0xd9pzdEkFApIj7Ng...[作者空间]
Storm是一个开源的分布式实时计算框架,可以简单、可靠的方式进行大数据流处理。通常用于实时分析,在线机器学习,次...[作者空间]
SparkStreaming是spark的一个子模块,用与快速构建可扩展,高吞吐量,高容错的流处理程序。通过高级A...[作者空间]
Spark支持以下六个核心数据源,同时Spark提供了上百种数据源的读取方式。CSV、JSON、Parquet、O...[作者空间]
Spark Sql是spark中的一个子模块,主要用于操作结构化数据。它具有如下特点:能够将SQL查询于Spark...[作者空间]
Spark所有模式均用spark-submit命令提交作业,其格式如下:./bin/spark-sbumit --...[作者空间]
在使用vmware的时候遇到了下面的网络问题,突然 Linux虚拟机的网络无法使用 报错 could not r...[作者空间]
beeline进入交互命令行 内部表 外部表 分区表 分桶表 分桶表&分区表 导入数据的时候需要指定分区 倾斜表 ...[作者空间]
因为Hive当中的HiveServer无法处理客户端的并发请求所以采用了HiveServer2。Beeline是一...[作者空间]
安装包:https://pan.baidu.com/s/15d7uOQqvGE3MY-8uQwGXZw 提取码:d...[作者空间]
Hive是一个构建在Hadoop之上的数据仓库,它可以将结构化的数据文件映射成表,并提供类SQL查询功能,用户查询...[作者空间]
1.引入pom文件 JavaApi对HDFS进行文件上传删除 重命名等操作[作者空间]
MapReduce是Hadoop的一个分布式计算框架,用于编写批处理应用程序。编写好的程序可以提交到Hadoop集...[作者空间]
Yarn是Hadoop2.0引入的集群资源管理系统。用户可以将各种服务框架部署在Yarn上,由Yarn进行统一地管...[作者空间]