CN / EN
banner圖
掌握核心技術 駕馭光的運用

行業新聞

深度學習是解決所有計算機視覺問題的最佳方案嗎?

日期:2019-04-26 來源:币游国际
         加州大學伯克利分校的JitendraMalik教授在2017年舉辦的嵌入式視覺峰會(EmbeddedVisionSummit)上進行了的一場精彩的主題演講。Malik在計算機視覺領域擁有30年的研究和教學積累,他解釋說,他一直對深度神經網絡(DNN)對計算機視覺的價值持懷疑態度,但是在麵對日益增長的令人印象深刻的結果時,他最終改變了主意。
深度學習是解決所有計算機視覺問題的最佳方案嗎?_heydanbo.com
         毫無疑問,DNN已經改變了計算機視覺領域。DNN在識別目標、在圖像內定位目標以及確定哪個像素屬於哪個目標等方麵,都能提供更好的結果。即使是像光流和立體匹配這樣的已經能用傳統技術很好地解決的問題,現在也可以用深度學習技術獲得更好的解決方案。深度學習的成功,遠遠超出了計算機視覺領域,它還涉及到語音識別等眾多領域。
         由於這些令人印象深刻的成功,深度學習在科研和產業領域吸引了大量的關注和投資。這些關注和投資,正在加速深度學習算法和有效實施這些算法方麵的進展,從而使深度學習技術能夠集成到越來越多的係統中,包括那些具有顯著的成本和功率限製的係統。
         深度學習真的適合所有問題嗎?
         這自然就提出了一個問題:如果你正在將計算機視覺功能集成到你的係統或應用中,你是否應該考慮除了深度學習以外的其他任何技術?在我的谘詢實踐中,越來越多的客戶希望通過深度學習來解決計算機視覺問題。但是我們發現,在某些情況下,其他類型的算法更合適解決問題。
         為什麽?
         首先,視覺世界是無限變化的,係統設計者有無數種方法使用視覺數據。其中有一些應用案例,如目標識別和定位,都可以通過深度學習技術得到很好的解決。因此,如果你的應用需要一種算法來識別家具,那麽你很幸運:你可以選擇一種深度神經網絡算法,並使用自己的數據集對其進行重新編譯。
         我們要先談談這個數據集。訓練數據對有效的深度學習算法至關重要。訓練一個DNN通常需要數千個帶標記的訓練圖像(即用所需輸出標記的圖像),以及數千個帶標記的圖像來評估候選訓練算法。當然,這些數據的性質非常重要:訓練和驗證數據,必須能夠代表算法要處理的情況的多樣性。如果很難或者不可能獲得足夠多樣化的訓練數據,那麽最好還是使用傳統技術。
         考慮使用其他技術而非DNN的另一個原因是,如果你要執行一項計算機視覺任務,而在以往的報道記載中,尚未使用DNN算法來解決這樣問題。在這種情況下,你可以嚐試使用為其他目的而創建的現有DNN算法;或者你也可以嚐試創建一個新的DNN算法來滿足自身需求。不管怎樣,你都是處在研究領域。這可能會令人望而生畏,因為很少有人和組織有開發新型深度神經網絡算法的經驗。而且,很難知道你是否能在可用的時間、精力和計算資源限度內取得成功。
         傳統技術與DNN的結合
         當我們深入研究客戶的需求時,我們經常發現,最初看起來像單一視覺問題的任務,往往可以分解為幾個子任務。通常,在這些子任務中,自然有一些子任務是適合使用DNN解決的,而另一些子任務則不適合用DNN來解決。對於這些項目,結合DNN和傳統技術的解決方案,通常是更好的選擇,而不是試圖將整個問題都強製轉向DNN解決方案。
         記住機器學習技術是多種多樣、變化多端的,這一點也非常重要。早在深度神經網絡普及之前,其他機器學習技術(如支持向量機,SVM)就已經被用於解決很多視覺問題,並且今天仍然很有用。
         鑒於DNN在研究和技術方麵的巨大投資,很明顯,DNN作為首選解決方案的適用範圍,將會繼續迅速擴大。然而,在可預見的未來,許多應用將通過傳統技術(包括其他形式的機器學習)或通過深度學習和傳統算法的組合,來獲得最好的解決方案。


返回列表