将窄依赖关系的尽量划分到一个Stage里面,来实现流水线计算提高效率。
Stage划分原理
原文:https://www.cnblogs.com/studyNotesSL/p/11409614.html