當前位置:編程學習大全網 - 網絡軟體 - 計算機視覺基本任務研究目標

計算機視覺基本任務研究目標

計算機視覺(Computer Vision)是研究如何使機器“看”的科學,即用攝像機和計算機代替人眼對目標進行識別、跟蹤、測量等任務。其與機器視覺的區別在於:計算機視覺側重對質的分析,如分類識別,這是貓還是狗;或進行身份確認,如車牌識別、人臉識別;或進行行為分析,如人群聚集等;而機器視覺側重對量的分析,如通過視覺去測量零件的直徑。計算機視覺的基本任務包括:圖像分類、目標定位、目標檢測、圖像分割等。

圖像分類(Image Classification):圖像分類任務的目標是輸出給定的圖像是什麽類別的問題,如回答這是壹張貓的圖像的問題;

目標定位(Object Localization):目標定位任務的目標是找到圖像中某壹類別的物體在圖像中的位置,輸出bounding box;即不僅要識別出是什麽類別的物體(類標簽),還要給出物體的位置,位置用bounding box標記。 目標定位通常是針對單個物體的。

目標檢測(Object Detection):目標檢測任務包含分類和目標定位,目標是用多個bounding box分別把多個物體的位置標記出來,並分別給出物體對應的類別。目標檢測通常是多個物體的定位任務。即不僅要識別圖像中的阿貓阿狗,還要給出阿貓阿狗的位置。

圖像分割(Image Segmentation):圖像分割任務的目標是將圖像細分為多個具有相似性質且不相交的區域,是對圖像中的每壹個像素加標簽的過程,即像素級的分割。圖像分割任務主要有語義分割(Semantic Segmentation)和實例分割(Instance Segmentation)兩種。語義分割的目標是將輸入圖像分為不同語義可解釋的類別(語義的可解釋性即分類類別在真是世界中是有意義的),每壹個像素點都要判斷其類別,是像素級別的分割。註意語義分割值判斷類別不區分個體,例如語義分割將圖像中屬於汽車的所有像素標記為藍色,對於圖像中有兩個藍色的像素,無法區分他們是屬於同壹個還是不同的汽車。實例分割的目的是確定圖像中存在的興趣目標位置和類別,機器自動從圖像中用目標檢測方法框出不同實例,再用語義分割方法在不同實例區域內進行逐像素標記。實例分割是目標檢測和語義分割的結合,但又不同於目標檢測和語義分割。相對物體檢測的邊界框,實例分割可精確到物體的邊緣;相對語義分割,實例分割可以標註出圖上同壹物體的不同個體,即哪些像素屬於第壹輛汽車,哪些像素屬於第二輛汽車。最後,還有壹個全景分割,它是語義分割和實例分割的結合。即每個像素都被分為壹類,如果壹種類別裏有多個實例,會用不同的顏色進行區分,就知道哪個像素屬於哪個類中的哪個實例。

註:上述任務中,最基本的是分類任務,其他任務都可在分類任務的基礎上,通過壹些技術手段解決,例如在圖片中加入很多窗口,提取每壹個窗口的特征,然後預測分類,並將分類壹樣並相鄰的窗口合並,就成了目標定位和目標檢測。

本文內容

參考資料:

/p/45acc16c6a94

/p/50996404

/p/39272659

  • 上一篇:在線:IP地址中的“網絡號”是什麽意思?
  • 下一篇:「幫研發找發行」6款主打畫風的遊戲
  • copyright 2024編程學習大全網