CNN的極簡單科普-你知道AI可以幫你找腳踏車嗎? - Medium

文章推薦指數: 80 %
投票人數:10人

CNN是目前統治了電腦視覺領域的一門關鍵技術,影像辨識可以做什麼呢? ... ILSVRC競賽. 可以說,CNN是目前人工智慧最具應用價值的技術了。

所有文章新手入門聯邦學習實作WithCodeCNN的極簡單科普-你知道AI可以幫你找腳踏車嗎?王柏鈞FollowFeb12,2020·6minread你知道AI可以幫你找腳踏車嗎?AI,在AlphaGo之前當代的大部分人知道AI大概都是在2016年的alphaGo擊敗世界棋王李世乭開始吧?當年我也深受震撼,輿論也開始謠傳著人工智慧來了,但當你深入了解,你會發現人工智慧早在2012年就已經大放異彩,這就是今天的主角─CNN(卷積神經網路)。

CNN是目前統治了電腦視覺領域的一門關鍵技術,影像辨識可以做什麼呢?假設今天你的腳踏車(又)不見了,你會很希望可以透過路口的攝像頭來找出到底你的腳踏車移動到哪裡去了,這時候,我們就會用到所謂的image-classification(影像辨識),他可以在不同的圖片中準確的找到你的腳踏車。

今天的分享,就是希望可以讓各位能夠深入的理解CNN的技術,以及他如何改變電腦視覺領域的遊戲規則。

PART1:傳統影像辨識技術的工作流程你知道傳統影像辨識有標準工作流程嗎?傳統的影像辨識大概分4個步驟,如下所示。

其中除了資料收集以外,特徵萃取是最為重要也是最講硬實力的地方,怎麼說呢?我們舉一個SobelFilter(原文連結)的例子好了。

PART2:CNN與SobelFilter(濾波器)的關聯SobelFiltercomponents特徵的萃取與Filter有著單一的對應關係:SobelFilter由兩個Filter組成,上方左圖是在X軸萃取特徵的Filter,上方右圖是在Y軸萃取特徵的Filter。

每一種Filter都是為了凸顯一種特徵而設計的。

我們可以直接看例子。

下方所示是我們要處理的影像,可以看出來是有腳踏車和磁磚牆的灰階照片。

原圖那如果我們用針對X軸的SobelFilter去進行計算,會得到的梯度圖如下所示。

經過SobelFilter的X軸梯度。

針對X軸的SobelFilter。

那如果針對Y軸呢?我們會得到如下的圖。

經過SobelFilter的Y軸梯度針對Y軸的SobelFilter我們在做特徵萃取的時候就是靠著這些Filter來跟圖片做一些神奇的計算,讓影像的特徵因為Filter而凸顯,使我們更容易將他進行分類。

事實上我們有許多種Filter,每一種都會凸顯出不同的特徵。

那到底,神奇的計算是什麼呢?其實就是我們經常聽到的卷積了。

也就是CNN的開頭(CNN,ConvolutionNeuralNetwork)。

有沒有很詫異,卷積神經網路的卷積這個技術竟然早就被廣泛使用了,那為什麼現在突然變得這麼厲害呢?這個部份我們就要看最後一個章節。

PART3:CNN與傳統影像辨識技術的差異特徵萃取,是傳統影像技術裡非常重要的一環,其中卷積有很大的作用。

透過卷積我們可以用各位Filter來調整影像,並得到各種特徵被強調的圖片。

但還記得上一章節的開頭嗎?「特徵的萃取與Filter有著單一的對應關係」所以在我們開始訓練分類器之前,我們就必須預先準備好要使用的Filter。

並期望透過這些Filter可以讓訓練的效果更好。

但這些Filter都是最好的嗎?CNN正是呼應這份質疑而誕生的。

由人所構想出的Filter受人的思考所局限,那如果不是由人來創造Filter呢?這裡就要提到CNN的後面兩個字,NN。

NN是NeuralNetwork的縮寫,中文是神經網路,是模仿人腦的運作機制所設計出來的一套演算法。

他有一個最大的優點那就是:彈性相較於傳統演算法一開始就侷限好的演算機制,把卷積結合神經網路所誕生的CNN可以隨機的產生許多的Filter,並且可以很好的找出一群對影像辨識有優異效能的Filter。

這件功能十分關鍵,因為只要隨機產生的數量夠多,讓CNN訓練的夠久,他就可以以趨近於窮舉法的方式暴力的找出最佳解。

簡單的說,他從無限的可能性中隨便找了一些組合,沒有原因、也沒有來由,你不知道他到底認出了輪子或把手,總之他就是可以知道那是腳踏車,這些最佳解通常超越人類的想像。

儘管針對應用的情境不同,他總是能找出最佳解。

摘自ConvolutionalNeuralNetworks(CNNs/ConvNets):這個,就是CNN之所以可以改變影像辨識領域遊戲規則的原因。

在現在,影像辨識領域的應用或競賽永遠都是CNN獨占鰲頭。

在2012年史丹佛的ILSVRC影像辨識競賽中,CNN一出現就遠遠甩開去年的冠軍9個百分點。

到了2015年,基於CNN發展的ResNet殘差神經網路更是已經比人類的錯誤率更低。

到現在,不管是Facebook的tag功能或是微軟即將推出的SurfaceDuo(2020)其中FaceID的人臉辨識解鎖功能,莫不是以CNN為基礎開發。

ILSVRC競賽可以說,CNN是目前人工智慧最具應用價值的技術了。

機器學習歷程機器學習的相關知識分享5MachineLearning新手入門5 claps5機器學習歷程機器學習的相關知識分享Writtenby王柏鈞Follow機器學習歷程機器學習的相關知識分享



請為這篇文章評分?