首页 > 其他 > 详细

hive parquet table 配置使用压缩

时间:2019-01-29 20:00:08      阅读:230      评论:0      收藏:0      [点我收藏+]

创建parquet table :

create table mytable(a int,b int) STORED AS PARQUET;


创建带压缩的parquet table:

create table mytable(a int,b int) STORED AS PARQUET TBLPROPERTIES(‘parquet.compression‘=‘SNAPPY‘);


如果原来创建表的时候没有指定压缩,后续可以通过修改表属性的方式添加压缩:

ALTER TABLE mytable SET TBLPROPERTIES (‘parquet.compression‘=‘SNAPPY‘);

或者在写入的时候set parquet.compression=SNAPPY;


不过只会影响后续入库的数据,原来的数据不会被压缩,需要重跑原来的数据。


采用压缩之后大概可以降低1/3的存储大小。
---------------------
作者:xiao_jun_0820
来源:CSDN
原文:https://blog.csdn.net/xiao_jun_0820/article/details/76893331
版权声明:本文为博主原创文章,转载请附上博文链接!

hive parquet table 配置使用压缩

原文:https://www.cnblogs.com/cenglinjinran/p/10335220.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!