Hbase Region合并

时间：2019-11-14 15:42:48 阅读：145 评论：0 收藏：0 [点我收藏+]

业务场景：

Kafka+SparkStreaming+Hbase
由于数据大量的迁移，再加上业务的改动，新增了很多表，导致rerigon总数接近4万（36个节点）

问题发现：

CDH界面较多关于web服务器相应时间过长，和队列刷新速度较慢。
streaming界面，每隔一段时间就会需要较长的处理时间

技术分享图片

解决过程：

【1】

首先把一些业务不需要的表disable掉，region下线，最后还剩2.5万个线上region，随后CDH页面无异常信息了，并且streaming处理时间都比较正常了（四类业务表现都相同）

技术分享图片

【2】

由于业务上每月都会有新表，所以以上的操作不能满足，经过研究，可以在保证表的请求量不高的情况下，把当前表的region合并，从而减少region数。而且Hbase集群目前已经停掉了region自动分裂，所以不会有在合并完之后再分裂的情况。

禁用分裂机制：

技术分享图片

集群配置：

技术分享图片

理论上讲，现在regionserver分配了64G内存，0.8的写入高水位线，也就是64*0.8=51.2G用作写，每个memstore占用128M，这么算的话理论上也就每个server400多个region的时候，不会造成过早的flush，总共下来400*36个，现在已经是超负荷运行了，所以还需要将Region进行合并。

合并代码：

public class Hbase_Merge {

public static void main(String[] args) throws Exception {

Configuration conf = HBaseConfiguration.create();

conf.set("hbase.zookeeper.property.clientPort", "2181");

conf.set("hbase.zookeeper.quorum", "zk1,zk2,zk3");

HBaseAdmin admin = new HBaseAdmin(conf);

List<HRegionInfo> regions = admin.getTableRegions(TableName.valueOf("TableName"));

Collections.sort(regions, new Comparator<HRegionInfo>() {

@Override

public int compare(HRegionInfo o1, HRegionInfo o2) {

return Bytes.compareTo(o1.getStartKey(),o2.getStartKey());

}

});

HRegionInfo regionInfo =null;

for (HRegionInfo r : regions){

int index =regions.indexOf(r);

if(index %2 == 0){

regionInfo = r;

}else{

System.out.println("start to merge two regions,NUM:"+index+" and "+(index+1) );

admin.mergeRegions(regionInfo.getEncodedNameAsBytes(),r.getEncodedNameAsBytes(),false);

System.out.println("merge two regions finished");

}

System.out.println("merge all regions finished");

}

结果：

最终Region数大量减少，Streaming任务也恢复正常。

后记：

IO高峰为合并region导致的，入Hbase的程序都将受到影响，Streaming批处理时间增长，中间还伴随着Region-In-Transition（此处影响不大）

建议：避开业务高峰期对Region合并

技术分享图片

这些都是之前存到有道上了，搬到这里费了好大的劲，还得不断学习，哈哈

Hbase Region合并

原文：https://www.cnblogs.com/changsblogs/p/11857544.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)