當前位置:編程學習大全網 - 源碼下載 - RFBnet 論文筆記

RFBnet 論文筆記

論文地址: /ruinmessi/RFBNet

主要說了目前表現好的目標檢測主要基於較深的網絡(例如Resnet,Inception),其缺點就是大量的計算成本,速度慢。而壹些輕量級的網絡速度較快,但檢測的精度相對不高。作者提出了RFB模塊,並將它添加到SSD的頂部,構建了RFBnet。

為了構建快速而強大的探測器,合理的替代方案是通過引入某些手工制作的機制來增強輕量級網絡的特征表示,而不是壹味地加深模型。

RFBnet 結構說明

RFB其實就是多分枝卷積塊,其內部結構由兩部分組成:

1.前壹部分與inception壹致,負責模擬多尺寸的pRF

2.後壹部分再現了人類視覺中pRF與離心率的關系

下圖給出了RFB及其對應的空間池區域圖

具體來說,首先,我們在每個分支中采用瓶頸結構,由1×1轉換層組成,以減少特征映射中的通道數量加上n×n轉換層。其次,我們用兩個堆疊的3×3轉換層替換5×5轉換層,以減少參數和更深的非線性層。出於同樣的原因,我們使用1×n加n×1轉換層來代替原始的n×n轉換層。最後,我們應用ResNet 和Inception-ResNet V2 的快捷方式設計。

也叫做astrous卷積層, 該結構的基本意圖是生成更高分辨率的特征圖,在具有更多上下文的更大區域捕獲信息,同時保持相同數量的參數

下圖示出了多分支卷積層和擴張合並或卷積層的兩種組合

所提出的RFB網絡探測器重用了SSD的多尺度和單級框架,其中RFB模塊被嵌入以改善從輕量級主幹提取的特征,使得探測器更準確且仍然足夠快。 由於RFB的特性可以輕松集成到CNN中,我們可以盡可能地保留SSD架構。 主要的修改在於用RFB代替頂部卷積層

使用與SSD中完全相同的骨幹網絡。 簡而言之,它是在ILSVRC CLS-LOC數據集上預先訓練的VGG16 ,其中fc6和fc7層被轉換為具有子采樣參數的卷積層,並且其pool5層從2×2-s2變至3×3-s1。 空洞卷積層用來填充空缺和所有dropout層,並移除fc8層。

保持相同的SSD級聯結構,但具有相對較大分辨率的特征映射的卷積層被RFB模塊取代。 在RFB的主要版本中,我們使用單壹結構設置來模仿離心率的影響。 隨著視覺圖之間pRF大小和離心率的差異,我們相應地調整RFB的參數以形成RFB-s模塊,其模擬淺人類視網膜圖中較小的pRF,並將其置於conv4 3特征之後,如 由於其特征映射的分辨率太小而無法應用具有大型內核(如5×5)的濾波器,因此保留了最後幾個卷積層。

train主要遵循SSD,包括數據增強,硬負挖掘,默認框的比例和寬高比,以及損失函數(例如,用於定位的平滑L1損失和用於分類的softmax損失),同時我們稍微改變了我們的學習速率調度 更好地適應RFB。 更多細節在以下實驗部分中給出。 使用MSRA方法初始化所有新的conv層。

後面主要是描述研究的成果,與其他網絡的對比,就不多描述了,以後補充更多關於RFBnet的細節

  • 上一篇:雙紅雲源代碼
  • 下一篇:求通達信均線角度公式
  • copyright 2024編程學習大全網