一.核心思想
把HQL当做MapReduce程序去优化。
注意,以下SQL不会转为MapReduce执行:
1.select仅查询本表字段。
2.where仅对本表字段做条件过滤。
二.启动Hive
备注:Hive依赖Zookeeper和HDFS,因此需要先开启!
三.Explain
Explain显示执行计划,Explain [EXTENDED] query
1.普通查询,不执行mapreduce任务
1.1.普通查询
1.2.不带EXTENDED的Explain
1.3.带EXTENDED的Explain
2.执行count(*),执行mapreduce
2.1 普通查询
2.2不带EXTENDED的Explain
2.3带EXTENDED的Explain
四.Hive运行模型
1.本地模型
2.集群模型
原文:https://www.cnblogs.com/yszd/p/10993207.html