HBase | 架构

作者: icebreakeros | 来源:发表于2019-07-02 15:39 被阅读0次

hbase架构

hbase是按照列存储的稀疏行/列矩阵
hbase支持两种数据版本回收方式:指定个数和指定时间

Hbase架构

关于region

  • 每个表最初只有一个region,当记录数增加到超过某个阈值时,开始分裂成两个region
  • 物理上所有数据存放在hdfs,由region服务器提供region的管理
  • 一台物理节点只能跑一个hregionserver
  • 一个hregionserver可以管理多个region实例
  • 一个region实例包括hlog日志和存放数据的store
  • hmaster作为总控节点
  • zookeeper负责调度

关于hlog

  • 用于灾难恢复
  • 预写式日志wal,记录所有更新操作,操作先记录进日志,数据才会写入
  • 每个region服务器只维护一个hlog,来自不同表的region日志是混合在一起的
  • hlog会被定期回滚

关于store

  • 每个region由一个或多个store组成,每个store保存一个列族的所有数据
  • 每个store由一个memstore和零个或多个storefile组成
  • storefilehfile的格式存储在hdfs上的,这些文件都是b树结构

客户端更新流程

  • 先连接有关的hregionserver,然后向region提交变更
  • 提交的数据首先写入wal(write-ahead log)memstore
  • memstore中的数据量达到某个阈值,hregionserver会启动flashcache进程写入storefile
  • storefile文件的数量增长到一定阈值后,系统会将多个storefile进行合并,在合并过程中会进行版本合并和删除工作,形成更大的storefile
  • 当单个storefile大小超过一定阈值后,会把当前的region分割为两个regions,并由hmaster分配到相应的region服务器,实现负载均衡
  • 客户端检索数据时,先在memstore找,找不到再找storefile

关于hmaster

  • hmasterregion分配给region服务器,协调region服务器的负载并维护集群的状态
  • hmaster不会对外提供数据服务,而是由region服务器负责所有regions的读写请求及操作
  • 如果hregionserver发生故障终止后,hmaster会通过zookeeper感知到,并处理相应的log文件,然后重新分配失效的regions
  • hmaster还负责管理表的schema和对元数据的操作

关于元数据表

  • .META.:记录了用户表的region信息,.META.可以有多个region
  • -ROOT-:记录了.META.表的region信息,-ROOT-只有一个region
  • zookeeper中记录了-ROOT-表的location
  • .META.表的regions全部保存在内存中
  • 客户端会将查询过的位置信息缓存起来,且缓存不会主动失效

相关文章

  • HBase学习笔记(二)HBase架构

    HBase Architectural Components(HBase架构组件) HBase架构也是主从架构,由...

  • HBase

    简述 1 HBase的应用场景 2 HBase的概念与定位 3 HBase架构体系与设计模型 HBase架构体系 ...

  • Hbase运行机制

    本文思路 Hbase是什么 Hbase的优劣 Hbase架构 Hbase容错 Hbase使用总结 HBase是什么...

  • (转) 深入HBase架构解析

    title: (转)HBase架构深入解析 tags: hbase categories: Hbase comme...

  • 数据存储-Hbase基础

    Outline 什么是Hbase 为什么需要Hbase Hbase的基础概念 Hbase的架构 Hbase的读写操...

  • code搬运工_HBaseClientAPI和架构

    HBaseClientAPI和架构 HBase架构HBase Master是服务器负责管理所有的HRegion服务...

  • Hbase架构和设计

    Hbase架构和设计

  • Hbase

    Hbase的架构:主从的架构方案 逻辑架构: region:逻辑的划分,一个region对hbase表的行级的划分...

  • HBase知识点

    深度分析HBase架构 HBase技术简介 Hbase 技术细节笔记(上) Hbase 技术细节笔记(下) 回答思...

  • HBase 对比 Kudu

    架构 HBase Master:管理与监控的RegionServer,管理HBase元数据; Zookeeper:...

网友评论

    本文标题:HBase | 架构

    本文链接:https://www.haomeiwen.com/subject/pgzzcctx.html