當前位置:編程學習大全網 - 編程語言 - 北大青鳥java培訓:八個最佳的數據中心開源挖掘工具?

北大青鳥java培訓:八個最佳的數據中心開源挖掘工具?

數據挖掘,又稱為資料探勘、數據采礦。

它是數據庫知識發現(英語:Knowledge-DiscoveryinDatabases,簡稱:KDD)中的壹個步驟,是壹個挖掘和分析大量數據並從中提取信息的過程。

其中壹些應用包括市場細分-如識別客戶從特定品牌購買特定產品的特征,欺詐檢測-識別可能導致在線欺詐的交易模式等。

在本文中,天津電腦培訓/整理了進行數據挖掘的8個最佳開源工具。

1、WekaWEKA作為壹個公開的數據挖掘工作平臺,集合了大量能承擔數據挖掘任務的機器學習算法,包括對數據進行預處理,分類,回歸、聚類、關聯規則以及在新的交互式界面上的可視化。

2、RapidMinerRapidMiner是世界領先的數據挖掘解決方案,在壹個非常大的程度上有著先進技術。

它數據挖掘任務涉及範圍廣泛,包括各種數據藝術,能簡化數據挖掘過程的設計和評價。

3、OrangeOrange是壹個基於組件的數據挖掘和機器學習軟件套裝,它的功能即友好,又很強大,快速而又多功能的可視化編程前端,以便瀏覽數據分析和可視化,基綁定了Python以進行腳本開發。

它包含了完整的壹系列的組件以進行數據預處理,並提供了數據帳目,過渡,建模,模式評估和勘探的功能。

其由C++和Python開發,它的圖形庫是由跨平臺的Qt框架開發。

4、KnimeKNIME(KonstanzInformationMiner)是壹個用戶友好,智能的,並有豐演的開源的數據集成,數據處理,數據分析和數據勘探平臺。

5、jHepWorkjHepWork是壹套功能完整的面向對象科學數據分析框架。

Jython宏是用來展示壹維和二維直方圖的數據。

該程序包括許多工具,可以用來和二維三維的科學圖形進行互動。

6、ApacheMahoutApacheMahout是ApacheSoftwareFoundation(ASF)開發的壹個全新的開源項目,其主要目標是創建壹些可伸縮的機器學習算法,供開發人員在Apache在許可下免費使用。

該項目已經發展到了它的最二個年頭,目前只有壹個公***發行版。

Mahout包含許多實現,包括集群、分類、CP和進化程序。

此外,通過使用ApacheHadoop庫,Mahout可以有效地擴展到雲中。

7、ELKIELKI(EnvironmentforDevelopingKDD-ApplicationsSupportedbyIndex-Structures)主要用來聚類和找離群點。

ELKI是類似於weka的數據挖掘平臺,用java編寫,有GUI圖形界面。

可以用來尋找離群點。

  • 上一篇:速求,奧運圖標代表的意義,象征什麽等有關問題,謝!
  • 下一篇:微軟VisualStudio2010實戰中的孫子兵法前言
  • copyright 2024編程學習大全網