首页 > 其他 > 详细

Hadoop深入浅出实战经典–第02讲

时间:2015-11-21 02:06:43      阅读:363      评论:0      收藏:0      [点我收藏+]

本文来源:通通学--知识学习与分享平台

转载链接:http://www.tongtongxue.com/archives/220.html

?

Hadoop的核心

HDFS:?Hadoop?Distributed File System 分布式文件系统

MapReduce:并行计算框架

Yarn:集群资源管理和调度框架

?

Hadoop是什么?

适合大数据的分布式存储、计算、资源管理平台

作者:Doug Cutting

受Google三篇论文的启发

?

Hadoop生态系统


bubuko.com,布布扣
?

HDFS


bubuko.com,布布扣
?

主从结构
主节点,只有一个: namenode
从节点,有很多个: datanodes

namenode负责:
接收用户操作请求
维护文件系统的目录结构
管理文件与block之间关系,block与datanode之间关系

datanode负责:
存储文件
文件被分成block存储在磁盘上
为保证数据安全,文件会有多个副本

?

Yarn


bubuko.com,布布扣
?

Yarn下的MapReduce

主从结构
主节点,只有一个: ResourceManager
控制节点,每个Job都有一个MRAppMaster
从节点,有很多个: YarnChild

ResourceManager负责:
接收客户提交的计算任务
把Job分给MRAppMaster执行
监控MRAppMaster的执行情况

MRAppMaster负责:
负责一个Job执行的任务调度
把Job分给YarnChild执行
监控YarnChild的执行情况

Hadoop深入浅出实战经典–第02讲

原文:http://09094224.iteye.com/blog/2258079

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!