什麼是機器視覺?
原理
機器視覺系統是指用電腦來實現人的視覺功能,也就是用電腦來實現對客觀的三維世界的識別。按現在的理解,人類視覺系統的感受部分是視網膜,它是一個三維採樣系統。
三維物體的可見部分投影到網膜上,人們按照投影到視網膜上的二維的像來對該物體進行三維理解。所謂三維理解是指對被觀察物件的形狀、尺寸、離開觀察點的距離、質地和運動特徵(方向和速度)等的理解。
基本構造
機器視覺系統主要由三部分組成:
圖像的獲取、圖像的處理和分析、輸出或顯示。
簡而言之,機器視覺技術可賦予工業設備「觀察」其作業的能力,並根據所見做出快速決策。機器視覺最常見的用途是視覺檢測與缺陷偵測、定位與測量零件,以及識別、分類與追蹤產品。

機器視覺的起源:傳統的機器視覺系統
早在人工智慧及機器學習出現之前,機器便有「視覺」能力。1970 年代初期,電腦開始利用特定的演算法來處理影像並識別基本特徵。這項傳統的機器視覺技術可偵測物體邊緣以定位零件、尋找有缺陷的色差,並分辨有洞孔的相連像素斑點。
傳統的機器視覺的操作相對簡單,無需人工智慧。文字必須像條碼一樣簡潔且清晰。形狀必須是可預測的,且符合確切樣式。傳統的機器視覺系統無法讀取手寫內容、辨認起皺的標籤,或是分辨蘋果和柳橙。
機器視覺是工業自動化的基礎技術之一。數十年來,它一直在協助提升產品品質、加速生產並最佳化製造與物流。現在,這項成熟的技術正在與人工智慧融合,並引領朝工業 4.0 轉型。
人工智慧的崛起:深度學習推斷與工業機器視覺
日漸強大的邊緣運算(網路邊緣及其他嵌入式與物聯網裝置),加上愈來愈多的人工智慧 (AI) 深度學習模型,正極度擴展機器視覺的能力。快速增長的能力正引領朝智慧工廠與工業 4.0 轉型。
人工智慧透過名為神經網路的模型,擴增了傳統的電腦視覺演算法。當電腦接收到影像或影像的視訊串流,機器視覺軟體便會比較該影像資料與神經網路模型。這個過程稱為深度學習推斷,可讓電腦識別出極細微的差異,如織物中微小的不協調圖案,以及電路板中的微觀缺陷。

