English繁體中文

視覺辨識系統

:::HOME視覺辨識系統

人工智慧AI的潮流

   隨著科技進步,電腦的效能同時也飛速般的成長,與之而來的是如何讓機器學習以及人工智慧變得更快、更準確,在溝通方面Chat gpt能在短時間內分析你輸入的內容並給予解答就是一個很好例子,而AI在視覺辨識領域上面也有所進展,就像特斯拉的自動駕駛,搭載的360鏡頭可以檢查車輛盲點並幫助你駛入車載360 度視野攝影鏡頭將檢查您的盲點並將您的車輛駛入相鄰車道,同時維持您的車速、避開自行車、摩托車和其他車輛。

神經網路的架構

   那到底什麼是神經網路呢?如同字面意思,是將類似於生物學上的神經網路的架構套用在機器學習上。拿人類的視覺舉例,當你看向一個手寫的數字時,你並不會有問題去辨識他是甚麼數字,明明寫出來的樣子不同,結果卻仍然相同。

20250708100405tjbh
               圖 1mnist dataset的數字

    當影像透過光線被眼睛捕捉到時,每條光線都會刺激到眼球最底部的視網膜,視網膜是由多個小細胞所組成,而每個視網膜細胞就像照片裡的像素點一樣,被刺激到時會有不同數值(如同圖1的白到黑的灰階),而這些數值會在神經網路中,一層層的被向下傳播,每次傳播都會計算一個結果並向下傳遞直到最後被大腦歸類出來。

    如果這麼說可能還是有點難理解,那你可以參考下圖:

20250708100508YD29
                                              圖2、神經網路的架構

眼睛就像是其中的input layer,當視網膜接收到光線時,每一個細胞就像是input layer的一個點,每個點都會攜帶收到的數值(在圖1中的例子是灰階值),而神經與神經之間是會互相連接,形成一個龐大的網路,就像是圖2layer layer 之間的線一樣。當數據通過這些線條的時候,會被計算並傳遞給下一層神經,直到最後被分類出來。過程就像下圖3:

20250708100652Ddvo
                                                        圖3、神經網路的架構2

神經網路的種類

       相信各位已經了解神經網路的架構了,那以下提供一些神經網路的種類

前饋神經網路(FNN)

       前饋神經網路從輸入節點到輸出節點,在一個方向上處理資料。一層中的每個節點會連線至下一層中的每個節點。回饋網路使用反饋程序,隨時間推移改善預測。

循環類神經網路 (RNN)

RNN 專為時間序列或自然語言等循序資料設計,這種類神經網路會使用回饋循環保留過去的輸入記錄,相當適合用來處理含有時間元件的資料。

卷積類神經網路 (CNN)

        CNN 經過特別設計,適用於有關圖像的工作。這種類神經網路會使用卷積層擷取圖像的特徵,進而辨識邊緣和形狀等模式。

生對抗網路 (GAN)

  GAN 由產生器和鑑別器構成,這種類神經網路的運作方式是讓這兩個元件對抗。產生器會生成資料,鑑別器則可評估資料的真實性。通常在生成圖像、影片和音訊時,兩者就會互相對抗,之後產生器即可生成更真實的資料。

神經網路的優勢

    神經網路的優勢是能從現有的資料,推算不屬於訓練資料的其他資料,且對於大多數學習演算法,隨著數據資料的增加,性能表現會提升,但常會在到達一個階段後,表現會趨於平緩,沒辦法繼續有效利用新數據來增強模型的準確度。而神經網路的深度學習可突破這個瓶頸。

資料來源
1:https://www.researchgate.net/figure/Examples-of-digit-3-and-0-in-MNIST-dataset_fig18_306262753
2:https://aws.amazon.com/tw/what-is/neural-network/
3:https://zh.pngtree.com/
什麼是神經網路:https://aws.amazon.com/tw/what-is/neural-network/
AI視覺是什麼:https://www.powerarena.com/zh-hant/blog/ai%E8%A6%96%E8%A6%BA-%E5%8E%9F%E7%90%86%E6%A0%B8%E5%BF%83%E6%8A%80%E8%A1%93%E8%A7%A3%E6%9E%90%E5%88%A9%E7%94%A8-ai%E8%A6%96%E8%A6%BA%E8%BB%9F%E9%AB%94-%E5%AF%A6%E7%8F%BE%E6%99%BA/
FNN:https://zh.wikipedia.org/zh-tw/%E5%89%8D%E9%A6%88%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C
反向傳播算法:https://zh.wikipedia.org/zh-tw/%E5%8F%8D%E5%90%91%E4%BC%A0%E6%92%AD%E7%AE%97%E6%B3%95
RNN:https://zh.wikipedia.org/zh-tw/%E5%BE%AA%E7%8E%AF%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C
CNN:https://zh.wikipedia.org/zh-tw/%E5%8D%B7%E7%A7%AF%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C
GAN:https://zh.wikipedia.org/zh-tw/%E7%94%9F%E6%88%90%E5%AF%B9%E6%8A%97%E7%BD%91%E7%BB%9C