首页 > 其他 > 详细

Spark RDD Union

时间:2015-10-19 17:23:59      阅读:287      评论:0      收藏:0      [点我收藏+]

示例
 
Spark多个RDD(数据格式相同)“组合”为一个RDD
 
代码
 
from pyspark import SparkConf, SparkContext
 
conf = SparkConf().setAppName("spark_app_union")
 
sc = SparkContext(conf=conf)
 
rdd1 = sc.parallelize(["line1", "line2", "line3"])
 
rdd2 = sc.parallelize(["line4", "line5"])
 
datas = rdd1.union(rdd2).collect()
 
sc.stop()
 
# [‘line1‘, ‘line2‘, ‘line3‘, ‘line4‘, ‘line5‘]
print datas

 

Spark RDD Union

原文:http://www.cnblogs.com/yurunmiao/p/4892233.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!