當前位置:編程學習大全網 - 網站源碼 - Spark RDD到底是個什麽東西

Spark RDD到底是個什麽東西

Spark RDD的英文是Resilient Distributed Datasets,即彈性分布式數據集。通俗壹點講,Spark是做大數據處理的,RDD是其中極為重要的數據抽象,海量數據會被拆分為多個分片放在不同的集群節點上,RDD就是這些分布式數據的集合。在Spark Scala中, RDD就是壹個類,每個RDD的實例表示壹個具體的分布式數據集合。詳見:/article/285.html#resilient-distributed-datasets-rdds

  • 上一篇:e4a保存內容到文件
  • 下一篇:源代碼安裝homebrew,我應該裝在哪個文件夾下
  • copyright 2024編程學習大全網