根據我個人經驗,提供關於使用卷積時的倆三個建議作為參考
1. 建議都採用3x3卷積,但增加卷積層數,根據計算2層3x3=1層5x5
原理:5x5卷積核的參數有25個,3x3卷積核的參數有9個,前者是後者的25/9=2.78倍。因此,GoogLeNet團隊提出可以用2個連續的3x3卷積層組成的小網絡來代替單個的5x5卷積層,即在保持感受野範圍的同時又減少了參數量
2. 盡可能的使用最多"卷積核",只要能在記憶體可用範圍內
3. 盡可能的使用較多的"卷積層",但要注意池化後圖形大小是否足夠
3. 平面層(傳統層)一定要使用Dropout,卷積可以不用,卷積層建議使用Batch Normalization(參考:http://t.ly/Zyof)
4. 建議使用image Generate,否則會在實際使用上造成問題(實際環境變化多)
5. 批次量的影響:批次數量大收斂慢但較為穩定,數量小則收斂快但跳動會比較大,不過批次量大時,可能會有OOM問題,建議批次量最大不要超過256,最小不要低於32,不過還是根據您手上的樣本量來決定。
6. 輸入層使用較多卷積時收斂慢,但會較為準確
文章標籤
全站熱搜