首页 > 其他 > 详细

记录一下SparkStreaming中因为使用redis做数据验证而导致数据结果不对的问题

时间:2015-07-24 20:09:51      阅读:229      评论:0      收藏:0      [点我收藏+]

先说业务,

在flatMap阶段,当前指标会在redis去验证数据是否是新用户,如果是新用户,那么进行统计,统计会将该新用户add至我们的redis容器中。。。

这个业务其实很简单。。。但坑自己的是,flatMap后的RDD,会被两个不同的action使用。。。

然后。。。我发现第二个action中永远是统计不到新用户了。。。。。

不知道大家看出来问题的原因了吗?  我TMD排查一天才找到原因。

因为flatMap是个transform,每次action才会执行。 而我执行两次action那么flatMap就会执行两次, 结果就是第二次执行时,肯定一个新用户就没有了啊。。。

好坑

好坑

坑TMD死我了。。。。

记录一下SparkStreaming中因为使用redis做数据验证而导致数据结果不对的问题

原文:http://www.cnblogs.com/hark0623/p/4674089.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!