Hadoop是什么?
开源的, 分布式存储 + 分布式计算平台
Hadoop的组成?
HDFS:分布式文件系统,存储海量的数据
MapReduce:并行处理框架,实现任务分解和调度
Hadoop可以用来做什么?
搭建大型数据仓库,PB级数据的存储、处理、分析、统计等业务
Hadoop的优势?
Hadoop版本的选择?
ver1.x稳定 ver2.x 不稳定 差别很大,课程用ver1.2
Hadoop的安装
<property> <name>hadoop.tmp.dir</name> //hadoop临时目录用来存放nn临时文件 <value>/usr/local/hadoop/tmp</value> //该目录必须预先手工创建不能删除 </property> <property> <name>hadoop.name.dir</name> <value>/usr/local/hadoop/name</value> </property> <property> <name>fs.default.name</name> //配置NN节点地址和端口号 <value>hdfs://hadoop.master:9000</value> //注意格式必须是host:port的形式 </property>
<property> <name>dfs.data.dir</name> <value>/usr/local/hadoop/data</value> </property>
4.mapred-site.xml
<property> <name>mapred.job.tracker</name> <value>hadoop.master:9000</value> </property>
原文:https://www.cnblogs.com/zhangyu317/p/11217277.html