首页 > 其他 > 详细

分布式并行计算MapReduce

时间:2019-06-03 16:06:49      阅读:82      评论:0      收藏:0      [点我收藏+]

 

1.用自己的话阐明Hadoop平台上HDFS和MapReduce的功能、工作原理和工作过程。

2.HDFS上运行MapReduce

1)准备文本文件,放在本地/home/hadoop/wc

技术分享图片

技术分享图片

 

2)编写map函数和reduce函数,在本地运行测试通过

技术分享图片

技术分享图片

 

3)启动Hadoop:HDFS, JobTracker, TaskTracker

技术分享图片

 

4)把文本文件上传到hdfs文件系统上 user/hadoop/input 

技术分享图片

 

5)streaming的jar文件的路径写入环境变量,让环境变量生效

技术分享图片

技术分享图片

 

6)建立一个shell脚本文件:streaming接口运行的脚本,名称为run.sh

技术分享图片

技术分享图片

7)source run.sh来执行mapreduce

 技术分享图片

 技术分享图片

 

8)查看运行结果

技术分享图片

 

分布式并行计算MapReduce

原文:https://www.cnblogs.com/dujunlin/p/10967806.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!