目录

  • 1 智能科学技术导论
    • 1.1 学科界定
    • 1.2 人工智能简史
    • 1.3 人脑机制
  • 2 算法运用
    • 2.1 算法构造
    • 2.2 算法结构
    • 2.3 问题求解
  • 3 环境感知
    • 3.1 视觉原理
    • 3.2 机器视觉
    • 3.3 景物理解
  • 4 思维运作
    • 4.1 语言理解
    • 4.2 依存性句法分析
    • 4.3 语境中意义获取
    • 4.4 意识整合
    • 4.5 艺术创作
  • 5 行为表现
    • 5.1 人体运动
    • 5.2 仿人行为
    • 5.3 机器歌舞
  • 6 智能接口
    • 6.1 人机会话
    • 6.2 情感交流
    • 6.3 脑机接口
  • 7 智能系统
    • 7.1 专家系统
    • 7.2 混合系统
    • 7.3 智能机器
  • 8 智能社会
    • 8.1 智能家居
    • 8.2 智能交通
    • 8.3 智慧城市
  • 9 展望
    • 9.1 机器困境
    • 9.2 智能哲学
    • 9.3 学科前景
机器视觉

什麼是機器視覺?


原理

機器視覺系統是指用電腦來實現人的視覺功能,也就是用電腦來實現對客觀的三維世界的識別。按現在的理解,人類視覺系統的感受部分是視網膜,它是一個三維採樣系統。

三維物體的可見部分投影到網膜上,人們按照投影到視網膜上的二維的像來對該物體進行三維理解。所謂三維理解是指對被觀察物件的形狀、尺寸、離開觀察點的距離、質地和運動特徵(方向和速度)等的理解。


基本構造

機器視覺系統主要由三部分組成:

圖像的獲取、圖像的處理和分析、輸出或顯示。

簡而言之,機器視覺技術可賦予工業設備「觀察」其作業的能力,並根據所見做出快速決策。機器視覺最常見的用途是視覺檢測與缺陷偵測、定位與測量零件,以及識別、分類與追蹤產品。



機器視覺的起源:傳統的機器視覺系統

早在人工智慧及機器學習出現之前,機器便有「視覺」能力。1970 年代初期,電腦開始利用特定的演算法來處理影像並識別基本特徵。這項傳統的機器視覺技術可偵測物體邊緣以定位零件、尋找有缺陷的色差,並分辨有洞孔的相連像素斑點。

傳統的機器視覺的操作相對簡單,無需人工智慧。文字必須像條碼一樣簡潔且清晰。形狀必須是可預測的,且符合確切樣式。傳統的機器視覺系統無法讀取手寫內容、辨認起皺的標籤,或是分辨蘋果和柳橙。

機器視覺是工業自動化的基礎技術之一。數十年來,它一直在協助提升產品品質、加速生產並最佳化製造與物流。現在,這項成熟的技術正在與人工智慧融合,並引領朝工業 4.0 轉型。


人工智慧的崛起:深度學習推斷與工業機器視覺

日漸強大的邊緣運算(網路邊緣及其他嵌入式與物聯網裝置),加上愈來愈多的人工智慧 (AI) 深度學習模型,正極度擴展機器視覺的能力。快速增長的能力正引領朝智慧工廠與工業 4.0 轉型。

人工智慧透過名為神經網路的模型,擴增了傳統的電腦視覺演算法。當電腦接收到影像或影像的視訊串流,機器視覺軟體便會比較該影像資料與神經網路模型。這個過程稱為深度學習推斷,可讓電腦識別出極細微的差異,如織物中微小的不協調圖案,以及電路板中的微觀缺陷。