opencv三維重建深度怎麽不隨視場變化

四、雙目匹配與視差計算

立體匹配主要是通過找出每對圖像間的對應關系，根據三角測量原理，得到視差圖；在獲得了視差信息後，根據投影模型很容易地可以得到原始圖像的深度信息和三維信息。立體匹配技術被普遍認為是立體視覺中最困難也是最關鍵的問題，主要是以下因素的影響：

（1）光學失真和噪聲（亮度、色調、飽和度等失衡）

（2）平滑表面的鏡面反射

（3）投影縮減（Foreshortening）

（4）透視失真（Perspective distortions）

（5）低紋理（Low texture）

（6）重復紋理（Repetitive/ambiguous patterns）

（7）透明物體

（8）重疊和非連續

目前立體匹配算法是計算機視覺中的壹個難點和熱點，算法很多，但是壹般的步驟是：

A、匹配代價計算

匹配代價計算是整個立體匹配算法的基礎，實際是對不同視差下進行灰度相似性測量。常見的方法有灰度差的平方SD（squared intensity differences），灰度差的絕對值AD（absolute intensity differences）等。另外，在求原始匹配代價時可以設定壹個上限值，來減弱疊加過程中的誤匹配的影響。以AD法求匹配代價為例，可用下式進行計算，其中T為設定的閾值。

圖18

B、匹配代價疊加

壹般來說，全局算法基於原始匹配代價進行後續算法計算。而區域算法則需要通過窗口疊加來增強匹配代價的可靠性，根據原始匹配代價不同，可分為：

圖19

C、視差獲取

對於區域算法來說，在完成匹配代價的疊加以後，視差的獲取就很容易了，只需在壹定範圍內選取疊加匹配代價最優的點（SAD和SSD取最小值，NCC取最大值）作為對應匹配點，如勝者為王算法WTA（Winner-take-all）。而全局算法則直接對原始匹配代價進行處理，壹般會先給出壹個能量評價函數，然後通過不同的優化算法來求得能量的最小值，同時每個點的視差值也就計算出來了。

D、視差細化（亞像素級）

大多數立體匹配算法計算出來的視差都是壹些離散的特定整數值，可滿足壹般應用的精度要求。但在壹些精度要求比較高的場合，如精確的三維重構中，就需要在初始視差獲取後采用壹些措施對視差進行細化，如匹配代價的曲線擬合、圖像濾波、圖像分割等。

有關立體匹配的介紹和常見匹配算法的比較，推薦大家看看Stefano Mattoccia 的講義 Stereo Vision: algorithms and applications，190頁的ppt，講解得非常形象詳盡。

1． opencv2.1和opencv2.0在做stereo vision方面有什麽區別了？

2.1版增強了Stereo Vision方面的功能：

(1) 新增了 SGBM 立體匹配算法（源自Heiko Hirschmuller的《Stereo Processing by Semi-global Matching and Mutual Information》），可以獲得比 BM 算法物體輪廓更清晰的視差圖（但低紋理區域容易出現橫/斜紋路，在 GCstate->fullDP 選項使能時可消減這種異常紋路，但對應區域視差變為0，且運行速度會有所下降），速度比 BM 稍慢， 352*288的幀處理速度大約是 5 幀/秒；

(2) 視差效果：BM < SGBM < GC；處理速度：BM > SGBM > GC ；

(3) BM 算法比2.0版性能有所提升，其狀態參數新增了對左右視圖感興趣區域 ROI 的支持（roi1 和 roi2，由stereoRectify函數產生）；

(4) BM 算法和 GC 算法的核心代碼改動不大，主要是面向多線程運算方面的（由 OpenMP 轉向 Intel TBB）；

(5) cvFindStereoCorrespondenceBM 函數的disparity參數的數據格式新增了 CV_32F 的支持，這種格式的數據給出實際視差，而 2.0 版只支持 CV_16S，需要除以 16.0 才能得到實際的視差數值。

2．用於立體匹配的圖像可以是彩色的嗎？

在OpenCV2.1中，BM和GC算法只能對8位灰度圖像計算視差，SGBM算法則可以處理24位（8bits*3）彩色圖像。所以在讀入圖像時，應該根據采用的算法來處理圖像：

int color_mode = alg == STEREO_SGBM ? 1 : 0;

//////////////////////////////////////////////////////////////////////////

// 載入圖像

cvGrabFrame( lfCam );

cvGrabFrame( riCam );

frame1 = cvRetrieveFrame( lfCam );

frame2 = cvRetrieveFrame( riCam );

if(frame1.empty()) break;

resize(frame1, img1, img_size, 0, 0);

resize(frame2, img2, img_size, 0, 0);

// 選擇彩色或灰度格式作為雙目匹配的處理圖像

if (!color_mode && cn>1)

{

cvtColor(img1, img1gray, CV_BGR2GRAY);

cvtColor(img2, img2gray, CV_BGR2GRAY);

img1p = img1gray;

img2p = img2gray;

}

else

{

img1p = img1;

img2p = img2;

}

3．怎樣獲取與原圖像有效像素區域相同的視差圖？

在OpenCV2.0及以前的版本中，所獲取的視差圖總是在左側和右側有明顯的黑色區域，這些區域沒有有效的視差數據。視差圖有效像素區域與視差窗口（ndisp，壹般取正值且能被16整除）和最小視差值（mindisp，壹般取0或負值）相關，視差窗口越大，視差圖左側的黑色區域越大，最小視差值越小，視差圖右側的黑色區域越大。其原因是為了保證參考圖像（壹般是左視圖）的像素點能在目標圖像（右視圖）中按照設定的視差匹配窗口匹配對應點，OpenCV 只從參考圖像的第 (ndisp - 1 + mindisp) 列開始向右計算視差，第 0 列到第 (ndisp - 1 + mindisp) 列的區域視差統壹設置為 (mindisp - 1) *16；視差計算到第 width + mindisp 列時停止，余下的右側區域視差值也統壹設置為 (mindisp - 1) *16。

00177 static const int DISPARITY_SHIFT = 4;

…

00411 int ndisp = state->numberOfDisparities;

00412 int mindisp = state->minDisparity;

00413 int lofs = MAX(ndisp - 1 + mindisp, 0);

00414 int rofs = -MIN(ndisp - 1 + mindisp, 0);

00415 int width = left->cols, height = left->rows;

00416 int width1 = width - rofs - ndisp + 1;

…

00420 short FILTERED = (short)((mindisp - 1) << DISPARITY_SHIFT);

…

00466 // initialize the left and right borders of the disparity map

00467 for( y = 0; y < height; y++ )

00468 {

00469 for( x = 0; x < lofs; x++ )

00470 dptr[y*dstep + x] = FILTERED;

00471 for( x = lofs + width1; x < width; x++ )

00472 dptr[y*dstep + x] = FILTERED;

00473 }

00474 dptr += lofs;

00475

00476 for( x = 0; x < width1; x++, dptr++ )

…

這樣的設置很明顯是不符合實際應用的需求的，它相當於把攝像頭的視場範圍縮窄了。因此，OpenCV2.1 做了明顯的改進，不再要求左右視圖和視差圖的大小（size）壹致，允許對視差圖進行左右邊界延拓，這樣，雖然計算視差時還是按上面的代碼思路來處理左右邊界，但是視差圖的邊界得到延拓後，有效視差的範圍就能夠與對應視圖完全對應。具體的實現代碼範例如下：

//////////////////////////////////////////////////////////////////////////

// 對左右視圖的左邊進行邊界延拓，以獲取與原始視圖相同大小的有效視差區域

copyMakeBorder(img1r, img1b, 0, 0, m_nMaxDisp, 0, IPL_BORDER_REPLICATE);

copyMakeBorder(img2r, img2b, 0, 0, m_nMaxDisp, 0, IPL_BORDER_REPLICATE);

//////////////////////////////////////////////////////////////////////////

// 計算視差

if( alg == STEREO_BM )

{

bm(img1b, img2b, dispb);

// 截取與原始畫面對應的視差區域（舍去加寬的部分）

displf = dispb.colRange(m_nMaxDisp, img1b.cols);

}

else if(alg == STEREO_SGBM)

{

sgbm(img1b, img2b, dispb);

displf = dispb.colRange(m_nMaxDisp, img1b.cols);

}

4． cvFindStereoCorrespondenceBM的輸出結果好像不是以像素點為單位的視差？

“@scyscyao：在OpenCV2.0中，BM函數得出的結果是以16位符號數的形式的存儲的，出於精度需要，所有的視差在輸出時都擴大了16倍(2^4)。其具體代碼表示如下：

dptr[y*dstep] = (short)(((ndisp - mind - 1 + mindisp)*256 + (d != 0 ? (p-n)*128/d : 0) + 15) >> 4);

可以看到，原始視差在左移8位(256)並且加上壹個修正值之後又右移了4位，最終的結果就是左移4位。

因此，在實際求距離時，cvReprojectTo3D出來的X/W,Y/W,Z/W都要乘以16 (也就是W除以16)，才能得到正確的三維坐標信息。”

在OpenCV2.1中，BM算法可以用 CV_16S 或者 CV_32F 的方式輸出視差數據，使用32位float格式可以得到真實的視差值，而CV_16S 格式得到的視差矩陣則需要除以16 才能得到正確的視差。另外，OpenCV2.1另外兩種立體匹配算法 SGBM 和 GC 只支持 CV_16S 格式的 disparity 矩陣。

5．如何設置BM、SGBM和GC算法的狀態參數？

（1）StereoBMState

// 預處理濾波參數

preFilterType：預處理濾波器的類型，主要是用於降低亮度失真（photometric distortions）、消除噪聲和增強紋理等, 有兩種可選類型：CV_STEREO_BM_NORMALIZED_RESPONSE（歸壹化響應）或者 CV_STEREO_BM_XSOBEL（水平方向Sobel算子，默認類型）, 該參數為 int 型；

preFilterSize：預處理濾波器窗口大小，容許範圍是[5,255]，壹般應該在 5x5..21x21 之間，參數必須為奇數值, int 型

preFilterCap：預處理濾波器的截斷值，預處理的輸出值僅保留[-preFilterCap, preFilterCap]範圍內的值，參數範圍：1 - 31（文檔中是31，但代碼中是 63）, int

// SAD 參數

SADWindowSize：SAD窗口大小，容許範圍是[5,255]，壹般應該在 5x5 至 21x21 之間，參數必須是奇數，int 型

minDisparity：最小視差，默認值為 0, 可以是負值，int 型

numberOfDisparities：視差窗口，即最大視差值與最小視差值之差, 窗口大小必須是 16 的整數倍，int 型

// 後處理參數

textureThreshold：低紋理區域的判斷閾值。如果當前SAD窗口內所有鄰居像素點的x導數絕對值之和小於指定閾值，則該窗口對應的像素點的視差值為 0（That is, if the sum of absolute values of x-derivatives computed over SADWindowSize by SADWindowSize pixel neighborhood is smaller than the parameter, no disparity is computed at the pixel），該參數不能為負值，int 型

uniquenessRatio：視差唯壹性百分比，視差窗口範圍內最低代價是次低代價的(1 + uniquenessRatio/100)倍時，最低代價對應的視差值才是該像素點的視差，否則該像素點的視差為 0 （the minimum margin in percents between the best (minimum) cost function value and the second best value to accept the computed disparity, that is, accept the computed disparity d^ only if SAD(d) >= SAD(d^) x (1 + uniquenessRatio/100.) for any d != d*+/-1 within the search range ），該參數不能為負值，壹般5-15左右的值比較合適，int 型

speckleWindowSize：檢查視差連通區域變化度的窗口大小, 值為 0 時取消 speckle 檢查，int 型

speckleRange：視差變化閾值，當窗口內視差變化大於閾值時，該窗口內的視差清零，int 型

// OpenCV2.1 新增的狀態參數

roi1, roi2：左右視圖的有效像素區域，壹般由雙目校正階段的 cvStereoRectify 函數傳遞，也可以自行設定。壹旦在狀態參數中設定了 roi1 和 roi2，OpenCV 會通過cvGetValidDisparityROI 函數計算出視差圖的有效區域，在有效區域外的視差值將被清零。

disp12MaxDiff：左視差圖（直接計算得出）和右視差圖（通過cvValidateDisparity計算得出）之間的最大容許差異。超過該閾值的視差值將被清零。該參數默認為 -1，即不執行左右視差檢查。int 型。註意在程序調試階段最好保持該值為 -1，以便查看不同視差窗口生成的視差效果。具體請參見《使用OpenGL動態顯示雙目視覺三維重構效果示例》壹文中的討論。

在上述參數中，對視差生成效果影響較大的主要參數是 SADWindowSize、numberOfDisparities 和 uniquenessRatio 三個，壹般只需對這三個參數進行調整，其余參數按默認設置即可。

在OpenCV2.1中，BM算法有C和C++ 兩種實現模塊。

（2）StereoSGBMState

SGBM算法的狀態參數大部分與BM算法的壹致，下面只解釋不同的部分：

SADWindowSize：SAD窗口大小，容許範圍是[1,11]，壹般應該在 3x3 至 11x11 之間，參數必須是奇數，int 型

P1, P2：控制視差變化平滑性的參數。P1、P2的值越大，視差越平滑。P1是相鄰像素點視差增/減 1 時的懲罰系數；P2是相鄰像素點視差變化值大於1時的懲罰系數。P2必須大於P1。OpenCV2.1提供的例程 stereo_match.cpp 給出了 P1 和 P2 比較合適的數值。

fullDP：布爾值，當設置為 TRUE 時，運行雙通道動態編程算法（full-scale 2-pass dynamic programming algorithm），會占用O(W*H*numDisparities)個字節，對於高分辨率圖像將占用較大的內存空間。壹般設置為 FALSE。

註意OpenCV2.1的SGBM算法是用C++ 語言編寫的，沒有C實現模塊。與H. Hirschmuller提出的原算法相比，主要有如下變化：

算法默認運行單通道DP算法，只用了5個方向，而fullDP使能時則使用8個方向（可能需要占用大量內存）。

算法在計算匹配代價函數時，采用塊匹配方法而非像素匹配（不過SADWindowSize=1時就等於像素匹配了）。

匹配代價的計算采用BT算法（"Depth Discontinuities by Pixel-to-Pixel Stereo" by S. Birchfield and C. Tomasi），並沒有實現基於互熵信息的匹配代價計算。

增加了壹些BM算法中的預處理和後處理程序。

上一篇:應屆生想進華為做android開發，需要哪些先決條件

下一篇:Cshell編程chinapub

玉溪java培訓學校告訴妳女生適合學習的專業有哪些？

物流管理專業世界第壹是哪個學校？

NDS 機戰K R4燒錄卡金手指