首页 > 编程语言 > 详细

pyspark数据需求写一个完整的python脚本

时间:2020-05-15 15:31:04      阅读:84      评论:0      收藏:0      [点我收藏+]
# 1.  import一些常用的库
from pyspark.sql import *
from pyspark.sql.functions import *
from pyspark.sql.types import *
import datetime

# 2. 开启一个session,这个后续写dataframe和sql函数的入口
spark = SparkSession.builder.appName("自定义一个名字").enableHiveSupport().getOrCreate()


# 3.写SQL代码,必须是正确的sql代码

sql = “”“

完整实现的sql代码,这个可以通过hue平台测试

”“”

#4. 将sql语句读入转成dataframe,然后存成csv文件,index表明要不要显示索引列

spark.sql(sql).toPandas().to_csv("文件名.csv", index=False)

  

pyspark数据需求写一个完整的python脚本

原文:https://www.cnblogs.com/ivyharding/p/12894846.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!