首页 > 其他 > 详细

HADOOP生态圈以及各组成部分的简介

时间:2017-07-26 21:36:19      阅读:213      评论:0      收藏:0      [点我收藏+]

技术分享

 重点组件:

HDFS:分布式文件系统

MAPREDUCE:分布式运算程序开发框架

Hive:基于大数据技术(文件系统+运算框架)的SQL数据仓库工具

Hbase:基于Hadoop的分布式海量数据库

ZOOKEEPER:分布式协调服务基础组件

Mahout:基于mapreduce/Spark/flink等分布式运算框架的机器学习算法

Oozie:工作流调度框架

Sqoop:数据导入导出工具

Flume:日志数据采集框架


HADOOP生态圈以及各组成部分的简介

原文:http://13153175.blog.51cto.com/13143175/1951181

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!