首页 > 技术文章 > HBase预分区和rowkey设计优化

leojie 2021-07-17 13:07 原文

1. 为什么要预分区

一张表被首次创建时,只会分配一个region给这个表。因此,在刚刚开始时,所有读写请求都会落在这个region所在的region server上,而不管你整个集群有多少个region server。不能充分地利用集群的分布式特性。

2. 最为常见的建表语句

create 'leo_test1',{NAME => 'info'}, { NUMREGIONS => 50, SPLITALGO => 'HexStringSplit'}

create 'leo_test2',{NAME => 'info'}, { NUMREGIONS => 50, SPLITALGO => 'DecimalStringSplit'}

create 'leo_test3',{NAME => 'info'}, { NUMREGIONS => 50, SPLITALGO => 'UniformSplit'}

各种Split算法适用场景:

  • HexStringSplit: rowkey是十六进制的字符串作为前缀的

  • DecimalStringSplit: rowkey是10进制数字字符串作为前缀的

  • UniformSplit: rowkey前缀完全随机

推荐阅读