首页 > 其他 > 详细

Chapter 4. Working with Key/Value Pairs

时间:2016-11-30 20:05:21      阅读:258      评论:0      收藏:0      [点我收藏+]

Chapter4 working with key/value pairs

key/values pairs键值对是Spark中非常常见的一种数据类型(type),RDD有时经常操作键值对数据类型。第四章的第一部分内容就是介绍有关键值对的ETL操作:extract,transform,load。第二部分内容介绍的是Spark中的一种高级特征,分布在多个节点nodespairs RDD布局layout:partioning,即分区。使用可控制的分区,可以降低节点间的通信成本,可以是spark的计算速度,这里使用的实例算法就是PageRank。

一、Creating Pair RDDs

 

Chapter 4. Working with Key/Value Pairs

原文:http://www.cnblogs.com/OliverZhang/p/6119320.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!