首页 > 其他 > 详细

Hive函数

时间:2020-10-04 21:43:52      阅读:38      评论:0      收藏:0      [点我收藏+]

@

1.查看函数

  • 函数有库的概念,系统提供的除外,系统提供的函数可以在任意库使用!
  • 查看当前库所有的函数:show functions;
  • 查看函数的使用: desc function 函数名
  • 查看函数的详细使用: desc function extended 函数名

2.函数的分类

按函数的来源:

  • ①系统函数,自带的,直接使用即可
  • ②用户自定义的函数。
    a)遵守hive函数类的要求,自定义一个函数类
    b)打包函数,放入到hive的lib目录下,或在HIVE_HOME/auxlib,auxlib用来存放hive可以加载的第三方jar包的目录
    c)创建一个函数,让这个函数和之前编写的类关联函数有库的概念
    d)使用函数

按函数的特征:

  • ①UDF: 用户定义的函数。 一进一出。 输入单个参数,返回单个结果!比如:cast(‘a‘ as int) 返回 null
  • ②UDTF: 用户定义的表生成函数。 一进多出。传入一个参数(集合类型),返回一个结果集!
  • ③UDAF: 用户定义的聚集函数。 多进一出。 传入一列多行的数据,返回一个结果(一列一行) 。比如:count(),avg(),sum()

常用函数

常用日期函数

hive默认解析的日期必须是: 2019-11-24 08:09:10
unix_timestamp:返回当前或指定时间的时间戳
from_unixtime:将时间戳转为日期格式
current_date:当前日期
current_timestamp:当前的日期加时间
to_date:抽取日期部分
year:获取年
month:获取月
day:获取日
hour:获取时
minute:获取分
second:获取秒
weekofyear:当前时间是一年中的第几周
dayofmonth:当前时间是一个月中的第几天
months_between: 两个日期间的月份,前-后
add_months:日期加减月
datediff:两个日期相差的天数,前-后
date_add:日期加天数
date_sub:日期减天数
last_day:日期的当月的最后一天

date_format格式化日期 date_format( 2019-11-24 08:09:10,‘yyyy-MM‘) mn

常用取整函数

round: 四舍五入
ceil: 向上取整
floor: 向下取整

常用字符串操作函数
upper: 转大写
lower: 转小写
length: 长度
trim: 前后去空格
lpad: 向左补齐,到指定长度
rpad: 向右补齐,到指定长度
regexp_replace: SELECT regexp_replace(‘100-200‘, ‘(\d+)‘, ‘num‘)=‘num-num
使用正则表达式匹配目标字符串,匹配成功后替换!

集合操作

size: 集合(map和list)中元素的个数
map_keys: 返回map中的key
map_values: 返回map中的value
array_contains: 判断array中是否包含某个元素
sort_array: 将array中的元素排序

Hive函数

原文:https://www.cnblogs.com/sunbr/p/13768409.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!