CN / EN
banner圖
掌握核心技術 駕馭光的運用

技術文章

計算機視覺的目的與意義

日期:2019-06-14 來源:币游国际
        從圖像處理和模式識別發展起來的計算機視覺研究對象之一是如何利用二維投影圖像恢複三維景物世界。計算機視覺使用的理論方法主要是基於幾何、概率和運動學計算與三維重構的視覺計算理論,它的基礎包括射影幾何學、剛體運動力學、概率論與隨機過程、圖像處理、人工智能等理論。
        計算機視覺要達到的基本目的有以下幾個:
        (1) 根據一幅或多幅二維投影圖像計算出觀察點到目標物體的距離;
        (2) 根據一幅或多幅二維投影圖像計算出目標物體的運動參數;
        (3) 根據一幅或多幅二維投影圖像計算出目標物體的表麵物理特性;
        (4) 根據多幅二維投影圖像恢複出更大空間區域的投影圖像。
        計算機視覺要達到的最終目的是實現利用計算機對於三維景物世界的理解,即實現人的視覺係統的某些功能。
        在計算機視覺領域裏,醫學圖像分析、光學文字識別對模式識別的要求需要提到一定高度。又如模式識別中的預處理和特征抽取環節應用圖像處理的技術;圖像處理中的圖像分析也應用模式識別的技術。在計算機視覺的大多數實際應用當中,計算機被預設為解決特定的任務,然而基於機器學習的方法正日漸普及,一旦機器學習的研究進一步發展,未來"泛用型"的電腦視覺應用或許可以成真。
        人工智能所研究的一個主要問題是:如何讓係統具備"計劃"和"決策能力"?從而使之完成特定的技術動作(例如:移動一個機器人通過某種特定環境)。這一問題便與計算機視覺問題息息相關。在這裏,計算機視覺係統作為一個感知器,為決策提供信息。另外一些研究方向包括模式識別和機器學習(這也隸屬於人工智能領域,但與計算機視覺有著重要聯係),也由此,計算機視覺時常被看作人工智能與計算機科學的一個分支。
        機器學習是研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能。它是人工智能的核心,是使計算機具有智能的根本途徑,其應用遍及人工智能的各個領域,它主要使用歸納、綜合而不是演譯。
        為了達到計算機視覺的目的,有兩種技術途徑可以考慮。
        第一種是仿生學方法,即從分析人類視覺的過程入手,利用大自然提供給我們的最好參考係--人類視覺係統,建立起視覺過程的計算模型,然後用計算機係統實現之。
        第二種是工程方法,即脫離人類視覺係統框框的約束,利用一切可行和實用的技術手段實現視覺功能。此方法的一般做法是,將人類視覺係統作為一個黑盒子對待,實現時隻關心對於某種輸入,視覺係統將給出何種輸出。
        這兩種方法理論上都是可以使用的,但麵臨的困難是,人類視覺係統對應某種輸入的輸出到底是什麽,這是無法直接測得的。而且由於人的智能活動是一個多功能係統綜合作用的結果,即使是得到了一個輸入輸出對,也很難肯定它是僅由當前的輸入視覺刺激所產生的響應,而不是一個與曆史狀態綜合作用的結果。
        不難理解,計算機視覺的研究具有雙重意義。
        其一,是為了滿足人工智能應用的需要,即用計算機實現人工的視覺係統的需要。這些成果可以安裝在計算機和各種機器上,使計算機和機器人能夠具有"看"的能力。
        其二,視覺計算模型的研究結果反過來對於我們進一步認識和研究人類視覺係統本身的機理,甚至人腦的機理,也同樣具有相當大的參考意義。


返回列表