當前位置:編程學習大全網 - 編程語言 - 大數據時代可能影響妳的七大商業趨勢

大數據時代可能影響妳的七大商業趨勢

大數據時代可能影響妳的七大商業趨勢

我們看到很多這樣的案例,企業願意分享自己在大數據運用上的成果。IT行業的任何paradigmshift,壹個特定的主題都會吸引新聞媒體、投資者和創新人才的大量關註,而這種轉變需要強大的商業價格的支持。這個典型的案例是:客戶服務、分布式計算和面向服務的架構和語言,比如JAVA。

我們也看到了壹個有益的生態系統的出現,這種生態系統迅速贊揚或擴大了核心支持技術。以大數據為例,大數據生態系統迅速集中了壹批技術提供商,如Hadoop、Cassandra、Accumulo、Oracle和IBM。

那麽在大數據的生態系統中,我可以看到哪些趨勢呢?

在hadoop上,有壹大批科技公司努力打造壹種無sql技術,為大數據提供解決方案,比如hadoop。但是,對sql語言支持的深度和廣度是不壹樣的。而使用sql的專業分析師可以利用這些優勢,通過sql語言很好地操作大數據。目前的案例有:hadapt,impala,teradatasterandemcgreenplompivotalhd。

(譯者註:由於目前的大數據存儲並不是基於關系數據庫,所以無法直接使用傳統的通過sql語言操作數據的方式。比如存儲在hadoop中的數據,不能通過sql直接查詢。因此,有必要轉換傳統的sql語言來操作。比如hadoop中的hive,就相當於把sql轉換成MapReduce,從而讀取和操作hadoop上的數據。)

對於結構化、非結構化和半結構化數據的統壹,以支持非結構化數據隨時增長,IDC公司預測數據量,其中大部分將以非結構化形式存儲,每天增長40%-50%。到2020年,數據總量將達到40ZB。非結構化數據主要來源於郵件、論壇、博客、社交網絡、POS系統和機器生成的數據。為了獲得和分析這些大量的數據,創新者必須擴展他們的大數據解決方案,而不僅僅是其中之壹。

在優化搜索之前,幾乎不可能從海量數據中找到用戶真正的搜索需求,猶如大海撈針。但隨著時間的發展,越來越多的大數據解決方案融入到檢索支持中。這壹領域的佼佼者有:LucidWorks,IBM,Oracle(通過收購Endeca)AutonomyandMarkLogic。LucidWorks將開源堆Lucene與Solr、Hadoop、Mahout和NLP結合在壹起。

ETL的擴展和支持很多人認為hadoop最初用於ETL是因為它的批處理功能。但是,如果妳看到復雜的hadoop平臺的所有基礎設施都是基於etl解決方案,妳可以使用其他純etl工具(Informatica、Talend、Syncsort、Clover ETL)來解決。這些年來,這些公司壹直在努力構建最有價值的ETL解決方案,現在我們更多地稱之為:數據集成解決方案。

純ETL提供商正在嘗試為大數據提供解決方案。這些支持不難包括:ETL,還有ELT,從hadoop轉化到hadoop。這將使公司能夠利用純ETL解決方案和hadoop本身的強大功能來構建這樣壹個環境。隨著時間的發展,這些純ELT公司支持的大數據解決方案範圍包括:NewSQL和NoSQL。

另外,我預計很多大數據解決方案公司都會嵌入對ETL和ELT的支持,就像很多傳統數據庫廠商已經嵌入或收購了ETL解決方案壹樣。

我在上壹篇文章中寫道,以Apache為開源框架的hadoop已經在面向批處理的海量分布式環境中使用,尤其是在分析的上下文中。任何時候,企業都開始關註如何控制和利用海量數據資源進行實時決策,我們期待這對‘大數據運動’的影響力和成長有很大的幫助。這種“落地”所代表的實時信息流,用於處理各行業的大數據流,包括資本市場、醫療7、能源、社交媒體等。

在大數據領域增加數據挖掘和分析技術的人都知道,他們需要在他們的平臺上擴大數據分析和統計功能的需求。除了壹般的分析功能,它還增加了非凡的數據挖掘功能。TeradataAste包含了很多分析功能,包括支持統計、文本挖掘、圖片、情感分析等等。其他公司如IBMNetezza也加入了對R語言的支持,可以支持R的各種包,如並行運算算法包、矩陣相關包等。在未來,我們可以看到大數據解決方案將繼續大幅增加這壹功能。

受益於R語言,毫無疑問,R語言將是壹種越來越流行的開源統計語言。RevolutionAnalytics在開發供“工業”使用的R版本方面顯著增強了性能,符合其他企業的特點。此外,他們還開發了壹個R擴展包,可以應用於hadoop和PureData。大學裏也開設了大量關於R語言的課程,使更多的學生具備了使用R語言和處理復雜統計分析的能力。可以預見,R將被納入很多大數據解決方案,它將顯著改進語言,使其具有更好的性能。

隨著大數據生態系統的發展,相關產業必然伴隨其發展。在當今競爭激烈的市場環境中,那些實施數據驅動戰略的公司將在競爭中獲得優勢。

以上是邊肖為妳分享的大數據時代可能影響妳的七大商業趨勢。更多信息可以關註環球常春藤分享更多幹貨。

  • 上一篇:Excel可以編程?
  • 下一篇:串口打印服務器如何設置打印機
  • copyright 2024編程學習大全網