當前位置:編程學習大全網 - 腳本源碼 - 機器學習中常見的算法的優缺點之決策樹

機器學習中常見的算法的優缺點之決策樹

決策樹在機器學習中是壹個十分優秀的算法,在很多技術中都需要用到決策樹這壹算法,由此可見,決策樹是壹個經典的算法,在這篇文章中我們給大家介紹決策樹算法的優缺點,希望這篇文章能夠更好的幫助大家理解決策樹算法。

其實決策樹倍受大家歡迎的原因就是其中的壹個優勢,那就是易於解釋。同時決策樹可以毫無壓力地處理特征間的交互關系並且是非參數化的,因此妳不必擔心異常值或者數據是否線性可分。但是決策樹的有壹個缺點就是不支持在線學習,於是在新樣本到來後,決策樹需要全部重建。另壹個缺點就是容易出現過擬合,但這也就是諸如隨機森林RF之類的集成方法的切入點。另外,隨機森林經常是很多分類問題的贏家,決策樹訓練快速並且可調,同時大家無須擔心要像支持向量機那樣調壹大堆參數,所以在以前都壹直很受歡迎。

那麽決策樹自身的優點都有什麽呢,總結下來就是有六點,第壹就是決策樹易於理解和解釋,可以可視化分析,容易提取出規則。第二就是可以同時處理標稱型和數值型數據。第三就是比較適合處理有缺失屬性的樣本。第四就是能夠處理不相關的特征。第五就是測試數據集時,運行速度比較快。第六就是在相對短的時間內能夠對大型數據源做出可行且效果良好的結果。

那麽決策樹的缺點是什麽呢?總結下來有三點,第壹就是決策樹容易發生過擬合,但是隨機森林可以很大程度上減少過擬合。第二就是決策樹容易忽略數據集中屬性的相互關聯。第三就是對於那些各類別樣本數量不壹致的數據,在決策樹中,進行屬性劃分時,不同的判定準則會帶來不同的屬性選擇傾向;信息增益準則對可取數目較多的屬性有所偏好,而增益率準則CART則對可取數目較少的屬性有所偏好,但CART進行屬性劃分時候不再簡單地直接利用增益率盡心劃分,而是采用壹種啟發式規則。

通過上述的內容相信大家已經知道了決策樹的優點和缺點了吧,大家在學習或者使用決策樹算法的時候可以更好的幫助大家理解決策樹的具體情況,只有了解了這些算法,我們才能夠更好的使用決策樹算法。

  • 上一篇:葛布為什麽不火
  • 下一篇:演醜女林無敵的李欣汝是不是結婚了?
  • copyright 2024編程學習大全網