希望one-stage detector可以達到two-stage detector的準確率,同時不影響原有的速度
在object detection領域,壹張圖像可能生成成千上萬的candidate locations,但是其中只有很少壹部分是包含object的,這就帶來了類別不均衡。
負樣本數量太大,占總的loss的大部分,而且多是容易分類的,因此使得模型的優化方向並不是我們所希望的那樣。
通過減少易分類樣本的權重,從而使得模型在訓練時更專註於難分類的樣本
CE在某種程度上不能處理正/負例子的重要性,這裏引入了壹個權重因子“α”,其範圍為[0,1],正類為α,負類為“1 -α”,這兩個定義合並在壹個名為“α”的名稱下,可以定義為
這個損失函數稍微解決了類不平衡的問題,但是仍然無法區分簡單和困難的例子。為了解決這個問題,我們定義了焦損失。
(1-pt)^γ為調變因子,這裏γ≥0,稱為聚焦參數。
1、當樣本分類錯誤時,pt趨於0,調變因子趨於1,使得損失函數幾乎不受影響。另壹方面,如果示例被正確分類,pt將趨於1,調變因子將趨向於0,使得損耗非常接近於0,從而降低了該特定示例的權重。
2、聚焦參數(γ)平滑地調整易於分類的示例向下加權的速率。
當γ=2時,與概率為0.9的示例相比,概率為0.9的示例的損失比CE和0.968低100倍,損失將降低1000倍。
下面的描述了不同γ值下的FL。當γ=0時,FL等於CE損耗。這裏我們可以看到,對於γ=0(CE損失),即使是容易分類的例子也會產生非平凡的損失震級。這些求和的損失可以壓倒稀有類(很難分類的類)。