javaSE,EE(SSM)
90%的大數據框架都是java寫的
如:MongoDB--最受歡迎的,跨平臺的,面向文檔的數據庫。
Hadoop--用Java編寫的開源軟件框架,用於分布式存儲,並對非常大的數據集進行分布式處理。
Spark --Apache Software Foundation中最活躍的項目,是壹個開源集群計算框架。
Hbase--開放源代碼,非關系型,分布式數據庫,采用Google的BigTable建模,用Java編寫,並在HDFS上運行。
MySQL(必須需要掌握的)
SQLon Hadoop又分:
batch SQL(Hive):壹般用於復雜的 ETL 處理,數據挖掘,高級分析。
interactive SQL:交互式 SQL 查詢,通常在同壹個表上反復的執行不同的查詢
operation SQL:通常是單點查詢,延時要求小於 1 秒,該類系統主要是HBase。
Linux
大數據的框架安裝在Linux操作系統上