Computer Vision Matrices 你不能不知道的重要矩陣!

這邊簡單用文字介紹幾個CV最常使用到的矩陣! 所有的矩陣特性都是彼此相關的,掌握的好,將可以在3D世界中暢行無阻呀!

  • Camera Matrix
  • Fundamental Matrix
  • Essential Matrix
  • Homography Matrix

本文僅介紹這些矩陣的主要用途,詳細推導要詳見各篇解說。

Camera Matrix

\[s\begin{bmatrix} u \\ v \\ 1 \end{bmatrix}=PX_{W}=K\begin{bmatrix} { R }_{ W }^{ C } & { t }_{ C } \end{bmatrix}{ X }_{ W }\]

在CV中最重要的矩陣,維度是3×4,在CG中通常稱為projection matrix(通常維度是4×4),包含了3D投影世界的全部訊息;數學符號常用\(P\)或\(M\)表示,由CV角度解釋Camera matrix可分解為intrinsic matrix與extrinsic matrix。在CG角度則可拆解為translation、rotation、projection三個步驟。

其中對應可理解為extrinsic,掌管相機的外部參數如translation與rotation。intrinsic,掌管相機的內部參數也就是projection。

而後的fundamental matrix、Essential matrix與Homography matrix皆是由camera matrix分解或乘積而來。因此理解camera matrix的所有特性並熟記每個element的作用和影響是相當重要的。所謂的camera calibration就是在根據影像的關係找出camera matrix,是所有實驗的基礎。

wiki

Essential Matrix

\[E=R[t]_{\times}\]

\[y^{‘}Ey=0\]

我跟他不熟,多半是解3D平面交點時才會用到。

wiki

Fundamental Matrix

\[x^{‘}Fx=0\]

fundamental matrix乍看之下與essential matrix相當類似,其實可以理解成essential matrix的2D轉換版本。是stereo影像間點對線(epipolar line)的對應關係。

最常使用在stereo matching的搜尋上,可以有效限制搜尋範圍在直線方程式上。加速後以全畫面的homography使epipolar line對齊,也就是我們熟知的image rectification。

在calibration中也常被用來做為benchmark,主要是計算點對epipolar line的距離來衡量投影準度(投影在線上才合理)。

wiki

網路上甚至有一首fundamental matrix song,詳盡的解釋了其特性!!XD

Homography Matrix

\[sp^{‘}=Hp\]

與fundamental matrix同為2D的轉換,不過這邊的對應則是點對點,在patch-based algorithm與stereo matching中是相當重要的矩陣,此外也被用在image stitching或稱panorama上。

wiki

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *