1.Transformation
Transformation用於對RDD的創建,RDD只能使用Transformation創建,同時還提供大量操作方法,包括map,filter,groupBy,join等,RDD利用這些操作生成新的RDD,但是需要註意,無論多少次Transformation,在RDD中真正數據計算Action之前都不可能真正運行。
2.Action
Action是數據執行部分,其通過執行count,reduce,collect等方法真正執行數據的計算部分。實際上,RDD中所有的操作都是Lazy模式進行,運行在編譯中不會立即計算最終結果,而是記住所有操作步驟和方法,只有顯示的遇到啟動命令才執行。這樣做的好處在於大部分前期工作在Transformation時已經完成,當Action工作時,只需要利用全部自由完成業務的核心工作。