當前位置:編程學習大全網 - 圖片素材 - 雲計算,大數據,數據挖掘,機器學習,模式識別。這些概念之間的關系是怎麽樣的?

雲計算,大數據,數據挖掘,機器學習,模式識別。這些概念之間的關系是怎麽樣的?

給妳解釋壹下這些術語:

雲計算:就是個炒得很熱的商業概念,其實說白了就是將計算任務轉移到服務器端,用戶只需要個顯示器就行了,不過服務器的計算資源可以轉包。當然,要想大規模商業化,這裏還有些問題,特別是隱私保護問題。

大數據:說白了就是數據太多了。如今幾兆的數據在20年前也是大數據。但如今所說的大數據特殊在哪呢?如今的問題是數據實在是太多了,這已經超過了傳統計算機的處理能力(區別與量子計算機),所以對於大數據我們不得不用壹些折衷的辦法(比如數據挖掘),就是說沒必要所有數據都需要精確管理,實際上有效數據很有限,用數據挖掘的方法把這些有限的知識提取出來就行了。·此外,數據抽樣,數據壓縮也是解決大數據問題的壹些策略。

數據挖掘:從數據中提取潛在知識,這些知識可以描述或者預測數據的特性。有代表性的數據挖掘任務包括關聯規則分析、數據分類、數據聚類等,這些妳在任壹本數據挖掘教材都可以了解。下面我說說和大數據的區別:數據挖掘只是大數據處理的壹個方法。馬雲所說的大數據,或者如今商業領域所說的大數據,實際上指的就是數據挖掘,其實真正所謂大數據,或者Science雜誌中提到的大數據,或者奧巴馬提出的大數據發展戰略,我的理解是,這些都遠遠大於數據挖掘的範疇,當然數據挖掘是其中很重要的壹個方法。真正目的是如何將大數據進行有效管理。

機器學習:這個詞很虛,泛指了壹大類計算機算法。重點是學習這個詞,如果想讓計算機有效學習,目前絕大多數方法都采用了叠代的方法。所以在科研界,只要是采用了這種叠代並不斷逼近的策略,壹般都可以歸到機器學習的範疇。此外,所謂學習,肯定要知道學什麽,這就是所謂訓練集,從訓練集數據中計算機要學到其中的某個壹般規律,然後用壹些別的數據(即測試集)來看看學得好不好,之後才能用於實際應用。所以,選取合適的訓練集也是個學問。

模式識別:意思就是模式的識別。模式多種多樣,可以是語言,可以是圖像,可以是事物壹些有意義的模塊,這些都算。所以總體來說,模式識別這個詞我是覺得有點虛,倒是具體的人臉圖像識別、聲音識別等,這些倒是挺實在的。也許是我不太了解吧。

另外說說妳的其他問題。

傳統分析方法不包括數據挖掘。對於數據分析這塊我不是很了解,不過可以肯定的是,傳統分析都有壹定的分析方向,比如我就想知道這兩個商品的關聯情況,那我查查數據庫就行了。數據挖掘雖說有些歷史,不過也挺時髦的,它是自動將那些關聯程度大的商品告訴妳,這期間不需要用戶指定數據分析的具體對象。

如果想應對大數據時代,數據挖掘這門課是少不了的。此外對數據庫,特別是並行數據庫、分布式數據庫,最好了解點。至於機器學習和模式識別,這些總的來說和數據挖掘關系不太大,除了壹些特殊的領域外。

總之,概念挺熱,但大數據還很不成熟,無論從研究上還是商業化上。我目前在作大數據背景下的算法研究,說實話,目前基本沒有拓展性非常強的算法,所以未來大數據的發展方向,我也挺迷茫。

PS:將數據挖掘應用於商業,最最重要的就是如何確定挖掘角度,這需要妳對具體應用的領域知識非常了解,需要妳有非常敏銳的眼光。至於數據挖掘的具體算法,這些就交給我們專門搞研究的吧!(對算法的理解也很重要,這可以把算法拓展到妳的應用領域)

  • 上一篇:1蒲式耳等於多少公斤
  • 下一篇:超級恐怖的鬼片 電影
  • copyright 2024編程學習大全網