Pythom語言:Python結合了R語言的快速,處理復雜數據的能力以及更務實的語言特質,迅速地成為主流,也更簡單和直觀了,尤其是近幾年的成長很快。在數據處理範疇內,通常在規模與復雜之間要有個取舍,Python以折中的姿態出現,是相當好的數據處理工具。
java語言:java沒有和Python和R語言壹樣好的可視化功能,也不是統計建模的最佳工具,但是如果妳需要建立壹個龐大的系統,使用過去的原型,java是最基本的選擇了。
Hadoop pand
Hive:為了迎合大量數據處理的需求,以java為基礎的大數據開始了。Hadoop為壹批數據處理,發展以java為基礎的架構關鍵,相對於其他處理工具,Hadoop慢許多,但是無比的準確可被後端數據庫分析廣泛使用,和Hive搭配的很好。
Scala:另壹個以java為基礎的語言,和java很像,對任何想要進行大規模的機械學習或是建立高階的算法,Scala是逐漸興起的工具,善於呈現且擁有建立可靠系統的能力。
Kafkaand Storm:是壹個特別快速的查詢信息系統,缺點是太快了,因此在實施操作時會犯錯,有時候會漏掉東西。使用Scala寫出來的架構,大幅增加他在串流處理的受歡迎程度。