根據我個人經驗,提供關於使用卷積時的倆三個建議作為參考

1.    建議都採用3x3卷積,但增加卷積層數,根據計算2層3x3=1層5x5

原理:5x5卷積核的參數有25個,3x3卷積核的參數有9個,前者是後者的25/9=2.78倍。因此,GoogLeNet團隊提出可以用2個連續的3x3卷積層組成的小網絡來代替單個的5x5卷積層,即在保持感受野範圍的同時又減少了參數量

2.    盡可能的使用最多"卷積核",只要能在記憶體可用範圍內
3.    盡可能的使用較多的"卷積層",但要注意池化後圖形大小是否足夠
3.    平面層(傳統層)一定要使用Dropout,卷積可以不用,卷積層建議使用Batch Normalization(參考:http://t.ly/Zyof)
4.    建議使用image Generate,否則會在實際使用上造成問題(實際環境變化多)
5.    批次量的影響:批次數量大收斂慢但較為穩定,數量小則收斂快但跳動會比較大,不過批次量大時,可能會有OOM問題,建議批次量最大不要超過256,最小不要低於32,不過還是根據您手上的樣本量來決定。
6.    輸入層使用較多卷積時收斂慢,但會較為準確

arrow
arrow
    創作者介紹
    創作者 夜市 小霸王 的頭像
    夜市 小霸王

    夜市小霸王

    夜市 小霸王 發表在 痞客邦 留言(0) 人氣()