首页 > 其他 > 详细

Hive动态分区 参数配置及语法

时间:2017-02-28 17:31:55      阅读:134      评论:0      收藏:0      [点我收藏+]

Hive本身是不支持动态分区的..

但动态分区是真的方便啊..不然手动维护要累死..按日期甚至小时来分区时动辄就好几千上万的分区..手动到哪一年去..?

想要用动态分区要先做一些设置来修改默认的配置..

set hive.exec.dynamic.partition=true;(可通过这个语句查看:set hive.exec.dynamic.partition;) 
set hive.exec.dynamic.partition.mode=nonstrict; 
SET hive.exec.max.dynamic.partitions=100000;(如果自动分区数大于这个参数,将会报错)
SET hive.exec.max.dynamic.partitions.pernode=100000;

可以直接把上述设置项在控制台中运行一下..以后就可以自由动态分区了..

建立分区表的语法.

Drop table table_name; --先删除表 没有则直接建表了
CREATE TABLE table_name    --创建表
(col1 string, col2 date, col3 double) 
partitioned by (datekey date)  --可以多个字段的组合分区 
 ROW FORMAT DELIMITED FIELDS TERMINATED BY , Stored AS TEXTFILE;

插入数据..

INSERT INTO TABLE table_Name

PARTITION (DateKey)

SELECT col1,col2,col3,DateKey FROM otherTable

WHERE DATEKEY IN (2017-02-26,2013-06-12,2013-09-24)

GROUP BY col1,col2,col3,DateKey  

DISTRIBUTE BY DateKey

删除分区:

ALTER TABLE table_Name DROP PARTITION (Datekey=2016-05-05);

以上为整理的部分关于Hive分区的资料..欢迎取阅..

 

Hive动态分区 参数配置及语法

原文:http://www.cnblogs.com/iiwen/p/6479607.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!