①自定义按某列排序
writablecomparable中的compareto方法
②topk中利用treemap
没有使用treemap:
https://blog.csdn.net/lzm1340458776/article/details/43228191
③自定义分区函数:实现按省份输出信息
④数据去重
Hadoop经典案例
原文:https://www.cnblogs.com/chengdonghui/p/10431010.html