首页 > 其他 > 详细

Spark学习三:Spark Schedule以及idea的安装和导入源码

时间:2016-05-01 01:12:05      阅读:232      评论:0      收藏:0      [点我收藏+]

Spark学习三:Spark Schedule以及idea的安装和导入源码

标签(空格分隔): Spark


一,RDD操作过程中的数据位置

[hadoop001@xingyunfei001 spark-1.3.0-bin-2.5.0]$ bin/spark-shell --master local[2]

val rdd = sc.textFile(“xx”, 2)
rdd.flatMap(.split(“\t”)).map((, 1)).reduceByKey((_ + _)).saveAsTextFile

Stage-01
part-01 -> Task-01 : rdd.flatMap(.split(“\t”)).map((, 1)).reduce
part-02 -> Task-02 :rdd.flatMap(.split(“\t”)).map((, 1)).reduce
Stage-02
part-01 -> Task-01 :ByKey((_ + _)).saveAsTextFile
part-02 -> Task-02 :ByKey((_ + _)).saveAsTextFile

rdd.cache

技术分享

二,Spark Schedule

技术分享

技术分享

技术分享

三,Idea导入spark源码

1,bin/idea.sh打开idea(进入时进度条点击取消)

2,集成maven

技术分享

3,导入源代码
技术分享

技术分享

技术分享

技术分享

技术分享

技术分享

技术分享

Spark学习三:Spark Schedule以及idea的安装和导入源码

原文:http://blog.csdn.net/youfashion/article/details/51288776

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!