分布式面向列的数据库

您所在的位置：网站首页 › 分布式数据库hbase是基于列存储的 › 分布式面向列的数据库

分布式面向列的数据库

2024-07-13 19:08| 来源: 网络整理| 查看: 265

文章目录概述Hbase VS RDBMS(关系数据库管理系统)Hbase数据模型逻辑视图rowkey列簇(column family)单元(cell)时间戳(timestamp) 物理视图 Hbase架构客户端HMasterRegionServerRegionzookeeper 优缺点优点缺点 Hbase读写数据流程-写数据客户端处理阶段Region写入阶段MemStore Flush阶段读数据CompactionMinor CompactionMajor Compaction Region split总结

概述

HBase是一个构建在Hadoop之上的高可用、高性能、多版本的分布式NOSQL数据库。通过在廉价服务器上搭建大规模结构化存储集群，提供海量数据高性能的随机读写能力。

NoSQL，指的是非关系型的数据库。NoSQL有时也称作Not Only SQL的缩写，是对不同于传统的关系型数据库的数据库管理系统的统称。NoSQL用于超大规模数据的存储。（例如谷歌或Facebook每天为他们的用户收集万亿比特的数据）。这些类型的数据存储不需要固定的模式，无需多余操作就可以横向扩展。

在这里插入图片描述

HBase位于结构化存储层，

Hadoop HDFS为HBase提供了高可靠性的底层存储支持，

Hadoop MapReduce等为HBase提供了高性能的计算能力，

Zookeeper为HBase提供了稳定服务和failover机制。

失效转移（failover）是一种备份操作模式，当主要组件由于失效或预定关机时间的原因而无法工作时，这种模式中的系统组件（比如服务器、网络或数据库）的功能被转嫁到二级系统组件。

phoenix和Hive等还为HBase提供了高层语言支持，使得在HBase上进行数据统计处理变的非常简单。

Sqoop等则为HBase提供了方便的RDBMS数据导入功能，使得传统数据库数据向HBase中迁移变的非常方便。

Hbase VS RDBMS(关系数据库管理系统) HbaseRDBMS数据类型只有字符串(字节数组)丰富的数据类型数据操作只支持增删改查支持SQL语句储存模式基于列存储基于行存储数据更新数据有多个版本更新后覆盖扩展性高有限 Hbase数据模型逻辑视图

从逻辑视图来说，HBase中的数据是以表形式进行组织的，而且和关系数据库中的一样，HBase中的表由行和列构成，因此HBase非常容易理解。

在这里插入图片描述

rowkey row key是用来检索记录的主键。访问hbase table中的行，只有三种方式:通过单个row key访问;通过row key的 range;全表扫描。row key行键 (Row key)可以是任意字符串(最大长度是 64KB，实际应用中长度一般为 10-100bytes)，在hbase内部， row key保存为字节数组。存储时，数据按照Row key的字典序(byte order)排序存储。设计key时，要充分利用排序存储这个特性，将经常一起读取的行存储放到一起。列簇(column family) hbase表中的每个列，都归属与某个列簇。列簇是表的schema的一部分(而列不是)，必须在使用表之前定义。列名都以列簇作为前缀。单元(cell) HBase中通过row和columns确定的为一个存贮单元称为cell。cell中的数据是没有类型的，全部是字节码形式存贮。时间戳(timestamp)

每个cell都保存着同一份数据的多个版本。

版本通过时间戳来索引。

时间戳可以由hbase(在数据写入时自动 )赋值，此时是精确到毫秒的当前系统时间。也可以由客户显式赋值。

每个cell中，不同版本的数据按照时间倒序排序，即最新的数据排在最前面。

hbase提供了两种数据版本回收方式。一是保存数据的最后n个版本，二是保存最近一段时间内的版本(比如最近

七天)。

物理视图

在这里插入图片描述

rowkey：列簇名：列名：时间戳：值

Hbase架构

在这里插入图片描述

客户端提供Shell命令行接口、原生Java API编程接口、Thrift/Rest API编程接口以及MapReduce 编程接口。HBase访问数据之前，首先通过元数据表定位目标数据所在的RegionServer，之后才会发送请求到RegionServer。同时这些元数据会被缓存再客户端本地，以方便之后的请求访问。如果集群RegionServer发生宕机或者执行了负载均衡等，从而导致数据分片发生的迁移，客户端需要重新请求最新的元数据并缓存至本地。 HMaster

处理用户的管理请求，例如:用户的增删改查等操作。

协调RegionServer为RegionServer分配Region。发现失效的RegionServer并重新分配其上的Region。监控集群上所有RS的健康状态(通过zk)。清理过期日志以及文件(Hlog和HFile)。 RegionServer

在这里插入图片描述

响应用户I/O请求,向HDFS文件系统中读写数据。

内部管理了一系列HRegion对象。

每个HRegion对应了Table中的一个Region，HRegion中由多个HStore组成。

每个HStore对应了Table中的一个ColumnFamily的存储。

HFile: HBase中KeyValue数据的存储格式，HFile是Hadoop的二进制格式文件。

HRegionServer中都包含一个WAL(write ahead log)。用于保存还未持久化存储的数据，用户数据的还原。

*实现数据的高可靠性:*HBase数据写入并非直接写入HFile，而是先写入缓存，再异步刷新落盘。为

防止数据丢失，数据写入缓存之前需要首先写入Hlog，这样，即使缓存数据丢失，仍然可以通过

Hlog日志恢复。（Hlog->cache->disk)

用于实现HBase集群件数据同步:通过回放主机群推送过来的Hlog日志来实现主从集群件数据的同步。

RS用于切分过大的Region。

BlockCache是HBase的读缓存，每个RS对应一个BlockCache。

客户端从磁盘读取数据之后通常会将数据缓存到系统内存中，后续访问同一行数据可直接从内存中

获取，对于大量热点读的业务请求来说，带来了极大的性能提升。

BlockCache缓存的对象是一系列的Block块(64KB)。由物理上相邻的多个KV组成。当前BlockCache主

要由两种实现:LRUBlockCache和BucketCache，后者在GC优化方面有明显的提升。

Region HBase使用RowKey将表“水平切割”成多个Region，Region代表的是数据表的一个分片，也是集群负载均衡的基本单位，通常一张表的Region会分布在整个集群的多个RS上，一个RS上会存在多个Region，当然这些Region一般来自不同的数据表。从HMaster的角度，每个 HRegion都纪录了它的StartKey 和EndKey。由于RowKey是排序的，因而Client可以通过 HMaster快速的定位每个 RowKey在哪个HRegion中。每个HRegionServer可以同时管理1000个左右的HRegion。 zookeeper

在这里插入图片描述

Zookeeper是一个分布式的协调服务(Apache顶级项目，基于google的chubby开源实现)。ZK管理着HBase的核心元数据，如:HMaster和HRegionServer的状态(available/alive等)，元数据表所在的RS地址等。ZK提供了宕机时通知功能，从而实现Hmaster的failover机制，RegionServer的failover机制。实现分布式表锁。

在这里插入图片描述

在HMaster和HRegionServer连接到ZooKeeper后创建Ephemeral节点，并使用Heartbeat 机制维持这个节点的存活状态。Hmaster的监控zookeeper的ephemeral节点来监控RS的存活状态(默认:/hbase/rs/*)。备用HMaster监控Zookeeper 中的ephemeral节点，如果 Active状态的HMaster宕机，且备用HMaster收到通知后切换为Active状态。优缺点优点容量巨大:单表可以支持千亿行，百万列的规模，数据容量可达到TB甚至PB级别。良好的扩展性稀疏性:HBase支持大量稀疏存储，允许大量的列值为空，但不占用存储空间。高性能:数据写操作性能强劲，对于随机单点读以及小范围的扫描读，其性能得到保证。对于大范围的读可以使用MR来实现高效的并行扫描。多版本:一个KV可同时保留多个版本。支持过期:支持TTL过期特性，只需要设置过期时间，超过TTL的数据被自动清理。Hadoop原生支持:高效数据扫描、导入;数据冷热分离;MR、Spark支持。缺点聚合运算:不能支持复杂的聚合运算。二级索引:HBase不支持二级索引。事务:HBase不支持跨行事务，只支持单行事务模型。 Hbase读写数据流程-写数据

写入流程概括为三个阶段

客户端处理阶段

客户端将用户的写入请求进行预处理，并根据集群元数据定位写入数据所在的RegionServer，将请求发送给对应的regionServer。

用户提交Put请求后，HBase客户端会将写入的数据添加到本地缓冲区中，符合一定条件就异步批量提交(默认autoflush=true时，请求直接提交给服务器处理;)。

客户端到hbase:meta中根据rowkey找到它们归属的RegionServer。批量请求时会把这些rowkey按照不同的regionServer分组。

客户端查询hbase:meta表在这里插入图片描述

首先查询自身的meta cache数据;若没有查到，到zookeeper节点(/hbase-root/meta-region-server) 查找。向hbase:meta所指向的RegionServer中发送查询请求，查询rowkey所在的region信息。收到返回结果之后，将结果缓存至本地，以备下次使用。

步骤3 客户端发送RPC请求给对应的RegionServer。

Region写入阶段

RegionServer接收到写入请求之后将数据解析出来，首先写入WAL，再写入对应的region列簇的MemStore。

RS收到写入请求后，首先反序列化put对象，执行各种检查(region是否只读，Memstore是否超过指定大小等)。执行写入操作。 1.建立行锁(Acquire locks)->2.更新写入时间->3.创建WAL edit对象->4.WAL edit写入Hlog->5.数据写入MemStore->6.释放行锁->7.刷写Hlog到HDFS->8.结束事务 MemStore Flush阶段

当Region中的MemStore容量超过一定阈值，系统会异步执行flush操作，将内存中的数据写入文件，形成HFile.

在这里插入图片描述

用户写入请求在完成Region memerstore之后就返回成功。Memstore flush是一个异步的执行过程。

触发条件

Memstore级别:Region中任意一个MemStore大小到了上限(可配，默认128MB)。

Region级别:region中所有memstore大小中和达到上限(可配)。

Regionserver级别:当regionServer中的MemStore的大小总和超过低水位阈值(可配)。

Hlog数量:Hlog数量达到一定上限(可配)时，系统会选取最早的Hlog对应的一个或多个region

进行刷新。

HBase定时刷新:(可配，默认为1小时)

用户手动刷新:例如:flush ‘tablename’

注:regionServer级别的flush会阻塞该RegionServer上的所有写操作，会对用户请求产生较大影响。

读数据

从ZooKeeper(/hbase/meta-region-server)中获取hbase:meta的位置(HRegionServer的位置)，缓存该位置信息。

从hbase:meta中查询用户Table对应请求的RowKey所在的HRegionServer，缓存该位置信息。

从查询到HRegionServer中读取Row。

Compaction 随着Hfile文件数量的不断增多，查询可能需要越来越多的IO操作，读取延迟会越来越大。执行Compaction会使文件个数基本稳定，进而读取IO的次数比较稳定，延迟就会稳定在一定范围。Compaction操作重写文件会带来很大的带宽压力，读的延迟会瞬间增大，这是因为compaction在执行的时候占用系统资源导致业务读取性能受到一定的波及。 Minor Compaction

HBase会自动拾取一些较小的HFiles，并将它们重新写入一些较大的HFiles中。 Minor compaction不会处理已经Deleted或Expired的Cell。

Major Compaction 将Region上一个列族对应的多个Hfile合并为一个大的Hfile文件。删除过期数据，被删除数据。改善Hbase读取效率。会引起磁盘IO和网络资源的紧缺。可以被设置为周期执行。 Region split Region的大小超过了hbase.hregion.max设置的值之后， region将被拆分。Memstore flush时会触发region的拆分。可以强制拆分。Region split过程。 Region下线。Region拆分。更新meta表。汇报给master。子region分配到regionServer上。总结 Hbase简介Hbase 与 RDBMSHbase数据模型架构优缺点数据读写数据稳定

【本文地址】

分布式面向列的数据库

分布式面向列的数据库

今日新闻

推荐新闻