技術支持
來源:光虎
人工智能,特別是通過深度學習的方式進行的機器學習,正在對整個世界產生巨大的有益影響。深度學習技術被用于無數應用,從賦予虛擬助理處理自然語言的能力,到通過推薦引擎增強電子商務體驗,到幫助醫(yī)療從業(yè)人員進行計算機輔助診斷,到在航空航天工業(yè)中執(zhí)行預測維護。深度學習技術也是工業(yè)4.0的關鍵推動者——這是在制造業(yè)中發(fā)生的第四次工業(yè)革命,特別是使用由數據和機器學習驅動的智能和自主系統(tǒng)——機器視覺技術是一個重要的貢獻者。需要注意的是,深度學習本身并不能處理各種形式的機器視覺任務,需要仔細的準備和維護才能真正有效。接下來將詳細介紹機器視覺——獲取和分析數字圖像的自動化計算機化過程,主要是為了確保質量、跟蹤和指導生產,即如何從深度學習中獲益。
機器視覺和深度學習面臨的挑戰(zhàn)
機器視覺處理在消費品和工業(yè)產品的制造和加工過程中經常遇到的識別、檢查、指導和測量任務。傳統(tǒng)的機器視覺軟件用特定的算法來解決這些任務;這些方法通常需要專門的知識、技能和經驗才能正確地實現。此外,這些方法或工具有時在處理和適應復雜變化條件下的能力方面存在不足。
深度學習針對此類應用有很大的幫助,但需要基于預先收集的樣本數據進行艱苦的訓練,以產生行業(yè)通常要求的結果水平(即3σ或至少99.7%的過程準確性)。此外,有時還需要進行更多的訓練,以考慮到可能對生產產出產生不利影響的不可預見的情況。重要的是要認識到,深度學習主要用于數據分類,并不是所有的機器視覺任務都適合這種方法。
深度學習的優(yōu)勢和劣勢
如前所述,深度學習是指諸如圖像或其組成像素等數據被分類為兩個或更多類別的過程。深度學習特別適合于識別對象或對象特征,例如,識別小部件A與小部件B的不同等等。
該技術還特別擅長應用在檢測缺陷,無論是存在缺陷或異物,還是在正在組裝的小部件中或小部件上沒有關鍵組件。還可以方便地識別文本字符和符號,如生產日期和批次代碼。
雖然深度學習擅長在復雜和可變的情況下使用,例如發(fā)現不規(guī)則不均勻、紋理圖像背景或一個小部件的圖像顯示為正常和可接受的方式變化(見圖1)。
使用深度學習進行分析是一個基于概率的過程,因此不適用,甚至不適合需要精確測量的工作。高精度測量仍然是傳統(tǒng)機器視覺軟件的所擅長的。條形碼和二維符號的解碼,本質上是基于特定的算法,也不是一個適合深度學習技術的領域(見圖2)。
圖一
圖二
深度神經網絡的介紹
深度學習是機器學習的最新表現,它本身被細分為三種不同的類型,即監(jiān)督學習、無監(jiān)督學習和強化學習。監(jiān)督學習是現在應用中最常用的方法。
深度學習技術利用深度神經網絡來執(zhí)行其分類功能。這些神經網絡的靈感來自于人類大腦處理感官輸入的方式,以解釋數據。具體來說,深度學習技術利用卷積神經網絡(CNN)來分析圖像。CNN也可以被稱為模型。
一個深度神經網絡由多個層組成(見圖3)。輸入層定義了神經網絡必須處理的圖像屬性。可以計算兩個或兩個以上的隱藏層提取特征(即邊、角等)。具有越來越高的復雜度,并建立了一個特征空間。最后,輸出層根據保留的特征建立分類,并提供所謂的推理或預測結果。
圖三
【來源:光虎光學內部培訓資料】