首页 > 其他 > 详细

【Spark】概述

时间:2015-07-13 13:48:42      阅读:243      评论:0      收藏:0      [点我收藏+]

大数据数据处理模型:

1.Google的MapReduce是一个简单通用和自动容错的批处理计算模型。但,适合交互式流式计算

2.Storm

3.Impala

4.GraphLab

5.Spark

 

Spark: 伯克利大学提出, RDD概念(一种新的抽象的弹性数据集),MapReduce的一种扩展。

RDD本质:在并行计算的各个阶段进行有效的数据共享。

Spark兼容hadoop,使用Scala语言编写,支持Java和Python接口。可实现图计算,交互查询,流计算,批处理。

【Spark】概述

原文:http://www.cnblogs.com/dplearning/p/4642433.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!