這邊簡單用文字介紹幾個CV最常使用到的矩陣! 所有的矩陣特性都是彼此相關的,掌握的好,將可以在3D世界中暢行無阻呀!
- Camera Matrix
- Fundamental Matrix
- Essential Matrix
- Homography Matrix
本文僅介紹這些矩陣的主要用途,詳細推導要詳見各篇解說。
Camera Matrix
\[s\begin{bmatrix} u \\ v \\ 1 \end{bmatrix}=PX_{W}=K\begin{bmatrix} { R }_{ W }^{ C } & { t }_{ C } \end{bmatrix}{ X }_{ W }\]
在CV中最重要的矩陣,維度是3×4,在CG中通常稱為projection matrix(通常維度是4×4),包含了3D投影世界的全部訊息;數學符號常用\(P\)或\(M\)表示,由CV角度解釋Camera matrix可分解為intrinsic matrix與extrinsic matrix。在CG角度則可拆解為translation、rotation、projection三個步驟。
其中對應可理解為extrinsic,掌管相機的外部參數如translation與rotation。intrinsic,掌管相機的內部參數也就是projection。
而後的fundamental matrix、Essential matrix與Homography matrix皆是由camera matrix分解或乘積而來。因此理解camera matrix的所有特性並熟記每個element的作用和影響是相當重要的。所謂的camera calibration就是在根據影像的關係找出camera matrix,是所有實驗的基礎。
Essential Matrix
\[E=R[t]_{\times}\]
\[y^{‘}Ey=0\]
我跟他不熟,多半是解3D平面交點時才會用到。
Fundamental Matrix
\[x^{‘}Fx=0\]
fundamental matrix乍看之下與essential matrix相當類似,其實可以理解成essential matrix的2D轉換版本。是stereo影像間點對線(epipolar line)的對應關係。
最常使用在stereo matching的搜尋上,可以有效限制搜尋範圍在直線方程式上。加速後以全畫面的homography使epipolar line對齊,也就是我們熟知的image rectification。
在calibration中也常被用來做為benchmark,主要是計算點對epipolar line的距離來衡量投影準度(投影在線上才合理)。
網路上甚至有一首fundamental matrix song,詳盡的解釋了其特性!!XD
Homography Matrix
\[sp^{‘}=Hp\]
與fundamental matrix同為2D的轉換,不過這邊的對應則是點對點,在patch-based algorithm與stereo matching中是相當重要的矩陣,此外也被用在image stitching或稱panorama上。
