平常晚上偶爾會帶女鵝去球場打球,因為我都是挑晚上六七點時練球,所以也不會有其他人,就跟女鵝練練投籃之類。

最近發現女鵝投籃命中率還滿高的,但是投球卻幾乎都是用直線投籃,利用打板進球。

原來是到現在為止,他都在籃下區域投籃(下圖藍色區域),所以直線投球打板也沒問題,只是我們知道投籃應該要用拋物線啊。

image

後來我就叫他改到籃下白線內地方投籃,這時因為非常靠近,他沒辦法用直線丟球了,只能學習想辦法把球投高成拋物線

image

這就讓我想到我在做AI影像辨識時常遇到的問題,舉一個例子,我常教學用的CNN「剪刀石頭布」,一般上課前我會先展示來引起學生興趣,所以我會先在家裡先拍了幾千張照片,然後完成訓練的模型,驗證的成功率也是接近100%,但是我上課要展示時,成功率可能只剩下60%。

我知道這應該是家中背景、燈光環境不同所導致,但是我對CNN的認識是提取所謂的「輪廓」,如果是輪廓的話,為何背景會有影響呢?

原來如果你訓練資料的背景長期都是一致,那麼這個背景很可能會被當作輪廓的一部分,所以你訓練的模型就必須要搭配這個背景才有能有效,一旦離開這個背景,就無法適應,而導致成功率偏低。

這就是在AI領域很常提到的「OverFit」,我常舉例說,「AI其實是一個很乖的學生,他會很認真的背你給的題庫」,但是這個乖學生如果只會背,那他就會掉入窠臼,無法回答新題型。

那要如何避免這個問題?當然就是要收集多種背景底下的影像,這樣CNN才能認知說原來我們要的是那個主體是「手的姿勢」,因為雖然背景一直在變化,但是手如果一直是剪刀的樣子,他的TAG就是剪刀,其餘亦同。長久下來他就能找出我們所要辨識的那個關鍵「輪廓」。

那跟女鵝投籃有什麼關係?

當女鵝長期在特定的區域投籃,那麼長久下來他就會認為這一種投籃方式是對的,萬無一失的,但其實他不知道這種的方式只適合特定那個區域,如果換到另外一個區域就失敗了。

這時如果我們強制把他調換到不同區域,他就會發現這樣直線投籃的方式是行不通的,只能學習新的投籃方式,長久下來經過交互驗證,就可以學到正確的投籃方式了。

這不就與CNN辨識需要在多種背景底下學習的道理一樣嗎?

 

    全站熱搜

    夜市 小霸王 發表在 痞客邦 留言(0) 人氣()