首页 > 其他 > 详细

spark wordcount 第一个spark 程序

时间:2016-04-02 02:14:30      阅读:293      评论:0      收藏:0      [点我收藏+]

?

?

?

wordcount

package com.baoy.worldcount

import org.apache.spark.{SparkConf, SparkContext}

/**
  * Created by cmcc-B100036 on 2016/4/1.
  */
object WordCount {
  def main(args: Array[String]) {
    if(args.length == 0) {
      println("usage: wordcount <file>")
      System.exit(1)
    }
    val conf = new SparkConf ().setAppName("wordcount")
    val sc = new SparkContext(conf)
    sc.textFile(args(0))
      .flatMap(_.split(" "))
      .map(x => (x, 1))
      .reduceByKey(_ + _)
      .foreach(println)
    sc.stop()
  }
}

?

?

pom

 <dependency>
      <groupId>org.apache.spark</groupId>
      <artifactId>spark-core_2.10</artifactId>
      <version>1.4.1</version>
      <scope>provided</scope>
    </dependency>

?

?

准备原始数据


bubuko.com,布布扣
?

在 /home/cloudera/baoyou/data/log

创建文件 wordcount.log ??

?

?在 hdfs 上创建 /data 路径

hdfs dfs -mkdir /data

?

?

上传 wordcount.log 到data路径

hdfs dfs -put wordcount /data/

?

?
bubuko.com,布布扣
?

?

运行 本地 spark-submit

 spark-submit  --class com.baoy.worldcount.WordCount --master local  /home/cloudera/baoyou/project/SparkDemo.jar /data/wordcount.log

?

?

运行结果:
bubuko.com,布布扣
?

?

?

?

?

?

spark wordcount 第一个spark 程序

原文:http://knight-black-bob.iteye.com/blog/2288046

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!