當前位置:編程學習大全網 - 腳本源碼 - boosting和bootstrap區別

boosting和bootstrap區別

bootstrap、boosting是機器學習中幾種常用的重采樣方法。其中bootstrap重采樣方法主要用於統計量的估計,boosting方法則主要用於多個子分類器的組合。bootstrap:估計統計量的重采樣方法(推薦學習:Python視頻教程)

bootstrap方法是從大小為n的原始訓練數據集DD中隨機選擇n個樣本點組成壹個新的訓練集,這個選擇過程獨立重復B次,然後用這B個數據集對模型統計量進行估計(如均值、方差等)。由於原始數據集的大小就是n,所以這B個新的訓練集中不可避免的會存在重復的樣本。

統計量的估計值定義為獨立的B個訓練集上的估計值θbθb的平均:

boosting:

boosting依次訓練k個子分類器,最終的分類結果由這些子分類器投票決定。

首先從大小為n的原始訓練數據集中隨機選取n1n1個樣本訓練出第壹個分類器,記為C1C1,然後構造第二個分類器C2C2的訓練集D2D2,要求:D2D2中壹半樣本能被C1C1正確分類,而另壹半樣本被C1C1錯分。

接著繼續構造第三個分類器C3C3的訓練集D3D3,要求:C1C1、C2C2對D3D3中樣本的分類結果不同。剩余的子分類器按照類似的思路進行訓練。

boosting構造新訓練集的主要原則是使用最富信息的樣本。

更多Python相關技術文章,請訪問Python教程欄目進行學習!以上就是小編分享的關於boosting和bootstrap區別的詳細內容希望對大家有所幫助,更多有關python教程請關註環球青藤其它相關文章!

  • 上一篇:功夫派完美的天圖任務怎麽作
  • 下一篇:寧津縣天氣周六幾點開始下雨
  • copyright 2024編程學習大全網