Oob和oob在隨機森林中的作用？

在隨機森林裝袋法中，可以發現bootstrap的約1/3個樣本不會壹次出現在bootstrap收集的樣本集中，因此它們沒有參與決策樹的建立。這些數據稱為袋外數據oob，用於替代測試集誤差估計方法，可用於驗證模型。

先介紹壹下oob的用法，其中(x，y)代表輸入樣本和標簽，g代表構造的樹。

上圖中，g2，g3，gt不用(xN，yN)，所以g2，g3，gt可以用(xN，yN)作為驗證數據，然後用oob數據作為輸入，再輸入到模型中，然後投票，少數服從多數。類似地，對於(x1，y1)，(x2，y2)等也存在相同的計算。，最終計算出判斷錯誤的樣本比例為oob-error。