首页 > 其他 > 详细

Spark 2.4.5 DataFrame 调优

时间:2020-05-17 22:58:45      阅读:87      评论:0      收藏:0      [点我收藏+]

在内存中缓存数据

  • Spark SQL可以通过调用Spark .catalog. cachetable(“tableName”)或datafame .cache()来使用内存中的列格式缓存表。
  • Spark SQL将只扫描所需的列,并自动调整压缩,以最小化内存使用和GC压力。
  • 调用spark.catalog.uncacheTable(“tableName”)来从内存中删除该表。
  • 可以使用SparkSession上的setConf方法或使用SQL运行SET key=value命令来配置内存缓存。

   技术分享图片

调优参数

  •  还可以使用以下选项来调优查询执行的性能。在将来的版本中,随着自动执行更多的优化,这些选项可能会被弃用。

   技术分享图片

 

Spark 2.4.5 DataFrame 调优

原文:https://www.cnblogs.com/yjyyjy/p/12907463.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!