# 1. import一些常用的库 from pyspark.sql import * from pyspark.sql.functions import * from pyspark.sql.types import * import datetime # 2. 开启一个session,这个后续写dataframe和sql函数的入口 spark = SparkSession.builder.appName("自定义一个名字").enableHiveSupport().getOrCreate() # 3.写SQL代码,必须是正确的sql代码 sql = “”“ 完整实现的sql代码,这个可以通过hue平台测试 ”“” #4. 将sql语句读入转成dataframe,然后存成csv文件,index表明要不要显示索引列 spark.sql(sql).toPandas().to_csv("文件名.csv", index=False)
原文:https://www.cnblogs.com/ivyharding/p/12894846.html