1、下载喜欢的电子书或大量文本数据,并保存在本地文本文件中
wget http://www.gutenberg.org/files/1342/1342-0.txt

2、编写map与reduce函数
gedit mapper.py

gedit reduce.py

3、本地测试map与reduce

gedit my.txt

4、将文本数据上传至HDFS上

5、用hadoop streaming提交任务

6、查看运行结果

7、计算结果取回到本地


原文:https://www.cnblogs.com/zhongyaohong/p/13967194.html