且构网

分享程序员开发的那些事...
且构网 - 分享程序员编程开发的那些事

《HBase企业应用开发实战》—— 第3章 数 据 模 型

更新时间:2022-10-04 19:25:44

本节书摘来自华章出版社《HBase企业应用开发实战》一 书中的第3章,第3.1节,作者:马延辉 孟鑫 李立松 ,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

第3章 数 据 模 型

在开始使用HBase之前非常有必要先学习HBase的特性,因此本章将介绍HBase的逻辑模型、物理模型和访问HBase的方法等。和传统的关系型数据库类似,HBase以表(Table)的方式组织数据,应用程序将数据存入HBase的表中。HBase的表由行(Row)和列(Column)共同构成,与关系型数据库不同的是HBase有一个列族(Column Family)的概念,它将一列或者多列组织在一起,HBase的列必须属于某一个列族。
行和列的交叉点称为单元格(Cell),单元格是版本化的。单元格的内容也就是列的值是不可分割的字节数组,以二进制形式存储。HBase没有数据类型,任何列值都被转换成字节数组进行存储。HBase表中的行是通过行键(Rowkey)进行区分的,行键也是用来唯一确定一行的标识,不同的行键代表不同的行,行键也是一段字节数组,不论是字符串还是数字,最终都会被转换成字节数组进行存储。HBase表中的行是按Rowkey排序的,排序方式采用字典顺序,所有表中的行都必须要有Rowkey。
同时HBase是一种面向列的分布式的数据库,其物理模型和逻辑模型与传统的关系型数据库有很大的不同。下面我们将详细讲述HBase数据模型中的一些重要概念。