大數據的增加給企業管理大量數據帶來了挑戰,同時也帶來了機會.以下是大數據處理所必需的十大工具:
1.ApacheHive
.
Hive是建立在hadoop上的開源數據倉庫的基礎設施,通過Hive簡單地進行數據的ETL,結構化處理數據,查詢和處理Hadoop上的大數據文件.Hive提供了類似SQL的簡單查詢語言-HiveQL,為熟悉SQL語言的用戶查詢數據提供了便利.
2JaspersoftBI套件
Jaspersoft包是通過數據庫列生成報表的開源軟件.業界領導人發現Jaspersoft軟件是壹流的,很多企業為了將SQL表變成pdf,大家都可以在會議上審議.此外,JasperReports還提供了壹個連接配置單元來代替HBase.
3.1010data
1010data成立於2000年,是總部設在紐約的分析雲服務,旨在為華爾街的客戶提供服務,包括NYSEuronext、遊戲和電信.在設計上支持可伸縮性的大規模並行處理.還有自己的查詢語言,支持SQL函數和廣泛的查詢類型,包括圖和時間序列分析.這種私有雲的方法減少了客戶在基礎設施管理和擴張方面的壓力.
4.Actian
Actian以前的名字叫IngresCorp,客戶超過1萬人,正在擴大.通過Vectorwise和ParAccel擴展.這些發展分別導致了ActianVector和ActianMatrix的創建.有Apache、Cloudera、Hortonworks和其他發行版本.
5.PentahoBusinessAnalytics
在某種意義上,Pentaho與Jaspersoft相比,Pentaho始於報告生成引擎,但現在通過簡化新來源獲取信息的過程支持大數據處理.Pentaho的工具可以連接到MongoDB和Cassandra等NoSQL數據庫.據PeterWayner介紹,PentahoData(更有趣的圖形編程接口工具)有很多內置模塊,可以將其拖到圖像上連接.