CNN圖像分類小技巧(2)：Cosine Learning Rate Decay

論文連接

學習率的調整在深度學習的訓練中至關重要, 最常用也是被廣泛使用的是指數型lr衰減，其學習率的變化如下圖所示：

紅線所示是標準的指數型lr衰減。藍線是階梯式的lr衰減，可以在壹段時間內保持學習率的恒定。這種衰減方式的優點是收斂速度較快，簡單直接。

Loshchilov 提出了cosine annealing strategy。其簡化的版本是將學習率從初始值遵循余弦函數減小到零。假設batchs的總數是，那麽在batch , 學習率可以根據以下公式計算出來：

由圖所示, cosine decay在開始的時候緩慢的降低學習率，中間的時候幾乎是線性的降低學習率，快結束的時候重新緩慢的降低學習率。

上一篇:如何根據兩個條件顯示第三個單元格的內容

下一篇:zabbix 壹般怎麽排查 zabbix agentd 到 zabbix server 進程服務是否可用

相关文章

如何吃簡·安巖的即食燕窩？

vb以ADO無源連接方式不能連接SQL SERVER 2000數據庫？

在Word裏如何把簡譜打出來

esp32時鐘頻率在哪裏設置

如何通過微信辦理工行預約取號？

帝王傳奇——冷血大帝txt全集下載

請高手寫個選股公式：7日內兩根倍量柱

copyright 2024編程學習大全網