首页 > 其他 > 详细

Hive-分组之后取前n个

时间:2018-09-15 13:44:03      阅读:199      评论:0      收藏:0      [点我收藏+]

1. 统计国家每个省份出现次数最高的5个城市的名称

直观思维来考虑:

把 数据组织成:

国家     省份     出现次数(倒序)  城市

row_number() 根据partition by 生成次序 ,rank_code, 然后用rank_code 做限制  

2. sql 程序

select

country_name,

province_name,

city_name,

cnt_num,

row_number() over (partition by country_name, province order by cnt_num desc) rank_code

from table

where rank_code <= 5

 3. 参考文章链接

https://blog.csdn.net/mori66/article/details/54670204

 

Hive-分组之后取前n个

原文:https://www.cnblogs.com/gaoss/p/9650645.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!