由2D照片重建物體之3D模型 |
指導教授:賴尚宏 姓名:許秉慧 學校:清華大學 系級:資工03級 |
1. Introduction: 本次專題的目的在於藉由數位相機的拍攝,得到一張或多張物體的照片(由不同的角度拍攝這個物體),再利用這些照片,來重建出物體在三度空間中的立體模型。 一般來講,對於一個具有立體形狀的物體,想要知道他的結構, 一定得要知道長寬高等資訊,對於比較小的物體,像是小盒子, 小箱子這類物品得到這些資訊,用一般的尺量就可以很容易的得到了。但對於一棟高聳的建築物,除了以專門的測量儀器,請專業人士幫忙測量之外,便很難有比較簡單的方法可以得到他的結構資訊,於是開始研究是否可用更簡單的方法來收集必要的資料,然後藉由電腦的幫助復原出物體在空間中的3D形狀呢。我這一次的專題,就是希望可以藉著攝影—一種很方便的方法,拍下的物體照片,作為收集資料的方法,再將照出的照片用來算出物體在3度空間中真正的座標。
|
2. Theory: 我們舉物體的任一Edge為例,他在照相機中成像的原理如下圖所示:
Image plane可以視作是照相機的底片(實際上應該是在+Z的位置,而非圖中的-Z,但就成像原理來講,放在+Z或-Z都沒有差別),Camera
Coordination System的原點可以視作是照相機鏡頭的位置,3D line則是建築物的某個邊。首先,我們知道3D空間中的線都可用兩個參數(v,d)表示出來,其中
v 為線的方向向量而d為線上某點,這個點是在線上的所有點中,離原點最近的那一個點。 由(1)推出(2): 理論上,由(2)可知,真正的Rj及wTc會使下面兩個等式滿足。 但實際上只要滿足使CA1,C2最小的Rj及wTc就被視作是真正的所求。求出預測的3D line座標跟圖中被標出的線之間的誤差。用來選擇使總誤差最小的Rj及wTc 將Rj及wTc帶入下面的公式中,使產生的Error最小,就是我們要的旋轉及平移矩陣了。
|
3. Algorithm:
|
4. Experimental Results:
|
5. References:
|