首页 > 其他 > 详细

Hadoop学习笔记

时间:2018-12-04 14:05:44      阅读:225      评论:0      收藏:0      [点我收藏+]

————厦门大学mooc:大数据技术原理与应用

两大核心:

分布式文件系统(HDFS)、分布式并行框架(MapReduce)

hadoop的特性:

1.高可靠性:Hadoop平台采用冗余副本机制

2.高效率

3.很好的扩展性

4.高容错性

5.成本低

技术分享图片

Hadoop的结构:

技术分享图片

技术分享图片

Hive:在Hadoop中实现数据仓库的功能,可支持SQL语句(通过Hive转换成MapReduce语句)

Pig:实现流式处理,提供类似SQL的查询语言:Pig Latin(轻量级)

Oozie:调度完成不同的作业

zookeeper:负责分布式锁、集群管理等

HBase:支持随机读写和实时应用

Flume:日志收集,如收集实时性的流

Sqoop:用于在Hadoop与传统数据库之间进行数据传递

Ambari:部署、管理

 

Hadoop学习笔记

原文:https://www.cnblogs.com/cellphone7/p/10063440.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!