3. MapReduce----MapReduce是一种计算模型,用以进行大数据量的计算。
(二)三大核心项目目录结构
1.Common: 源码位于src/core文件夹下 src/core: --org.apache.hadoop --classification --conf --filecache(空) --fs --ftp --kfs --permission --s3 --s3native --shell --http --lib --io --compress --bzip2 --snappy --zlib --file.tfile --nativeio --retry --serializer --ipc --metrics --jmx --log --metrics --metrics --file --ganglia --jvm --spi --util --metrics2 --filter --impl --lib --sink --ganglia --source --util --net --record --compiler --ant --generated --meta --security --authentication --client --server --util --authorize --token --delegation --util --bloom --hash 2. HDFS:源码位于src/hdfs文件夹下 src/hdfs org.apache.hadoop.hdfs --protocol --security.token --block --delegation --server --balancer --common --datanode --metrics --web.resources --namenode --metrics --web.resources --protocol --tools --util --web --resources 3.MapReduce:源码位于src/mapred文件夹下 src/mapred --org.apache.hadoop --filecache --mapred --jobcontrol --join --lib --aggregate --db --pipes --tools --mapreduce --example(空) --lib --db --fieldsel --input --jobcontrol --map --output --partition --reduce --security --token --delegation --server --jobtracker --tasktracker --split
原文:http://blog.csdn.net/zhouhong1026/article/details/19831135