2.1 彩虹照明方案
感測器喺其底座使用咗一圈可定址RGB LED。同使用離散彩色光源(例如從唔同方向發出紅、綠、藍光)嘅方法唔同,呢啲LED被編程以發射連續、空間變化嘅彩虹光譜。喺內部反射、塗有半鏡面塗層嘅曲面感測表面上,形成平滑嘅顏色梯度。當物體令柔軟嘅彈性體表面變形時,相機會捕捉到改變咗嘅顏色圖案。呢張單一、混合嘅梯度圖像,包含咗從以顏色編碼嘅多個有效「照明方向」獲得嘅足夠資訊,令到只需單次相機拍攝就可以應用光度立體視覺技術,相比多相機或多閃光燈系統,硬件更簡化。
RainbowSight代表咗機械人領域中,基於相機嘅觸覺感測技術嘅一個重大進步。呢個由麻省理工學院開發嘅感測器系列,解決咗一個關鍵瓶頸:從曲面同全方位嘅感測表面提供高解析度、局部幾何反饋。相比傳統平面感測器,呢種設計更仿生,更適合複雜操作。核心創新在於採用咗一種新穎嘅彩虹照明方案,使用可定址RGB LED,簡化咗光學設計,提升咗可製造性,並能夠喺曲面上實現準確嘅光度立體視覺,進行3D形狀重建。
開發動機源於之前系統(例如GelSight)嘅限制。雖然GelSight提供優異數據,但通常體積龐大、設計扁平,難以適應唔同嘅末端執行器幾何形狀。RainbowSight嘅設計理念優先考慮可定制性、易於製造同最少光學調校,令複雜嘅觸覺感測對機械人學家而言更易於實現。
RainbowSight嘅架構圍繞三個關鍵組件構建:照明系統、曲面感測主體同校準流程。
感測器喺其底座使用咗一圈可定址RGB LED。同使用離散彩色光源(例如從唔同方向發出紅、綠、藍光)嘅方法唔同,呢啲LED被編程以發射連續、空間變化嘅彩虹光譜。喺內部反射、塗有半鏡面塗層嘅曲面感測表面上,形成平滑嘅顏色梯度。當物體令柔軟嘅彈性體表面變形時,相機會捕捉到改變咗嘅顏色圖案。呢張單一、混合嘅梯度圖像,包含咗從以顏色編碼嘅多個有效「照明方向」獲得嘅足夠資訊,令到只需單次相機拍攝就可以應用光度立體視覺技術,相比多相機或多閃光燈系統,硬件更簡化。
感測器結構緊湊,具有一個曲面(通常係半球形或手指狀)嘅透明核心。設計具有可擴展性,原型尺寸從硬幣大小(約20毫米)到較大嘅夾爪安裝手指都有。一個關鍵優勢係減少咗對精確光學對準嘅需求。彩虹梯度本身具有容錯性,因為顏色編碼提供咗方向線索,減少咗對早期曲面觸覺感測器中常見嘅完美定位點光源嘅依賴。
系統需要一個校準步驟,將每個像素觀察到嘅顏色映射到相應嘅表面法向量。呢個步驟涉及喺彩虹照明下,捕捉未變形感測器嘅參考圖像,以建立(R, G, B) 色彩空間同 (Nx, Ny, Nz) 法線空間之間嘅映射關係。操作期間,會計算當前圖像同參考圖像之間嘅差異。使用預先校準嘅映射,將顏色變化解碼為表面法線估計。然後通過積分法線場來重建深度圖(一個2.5D高度場)。論文指出,相比之前嘅方法,呢個校準過程有所改進,從而得到更準確嘅深度圖。
呢個關係可以用光度立體視覺方程式概括,其中像素觀察到嘅強度 $I$ 係表面法線 $\mathbf{n}$、反照率 $\rho$ 同照明向量 $\mathbf{l}$ 嘅函數:$I = \rho \, \mathbf{n} \cdot \mathbf{l}$。喺RainbowSight中,照明向量 $\mathbf{l}$ 有效地編碼喺顏色通道中。
論文通過定性同定量實驗,提供咗令人信服嘅證據,證明RainbowSight嘅能力。
實驗展示咗感測器重建壓入其彈性體表面物體詳細幾何形狀嘅能力。例子包括螺絲、齒輪同其他具有複雜地形嘅細小零件。生成嘅深度圖同3D點雲(如PDF圖1 C & D所示)清晰顯示咗脊線、螺紋同輪廓。高空間解析度允許辨別對於物件識別同操作反饋至關重要嘅細微特徵。
作者將彩虹照明同其他用於相機觸覺感測器嘅常見照明策略(例如使用獨立單色LED)進行比較。展示嘅關鍵優勢包括:
RainbowSight嘅核心算法依賴於光度立體視覺。傳統光度立體視覺使用喺唔同已知照明方向下拍攝嘅靜態場景多張圖像,來求解每個像素嘅表面法線。RainbowSight嘅創新在於用單張圖像實現一種「顏色編碼光度立體視覺」。空間變化嘅彩虹照明模擬咗從唔同方向有多個光源同時作用,但通過其光譜特徵(顏色)區分開。點嘅表面法線會影響反射到相機嘅顏色混合。通過校準系統,呢種顏色混合被解碼返成法線向量。
數學公式涉及求解最能解釋喺照明矩陣 $\mathbf{L}$ 下觀察到嘅顏色向量 $\mathbf{I} = [I_R, I_G, I_B]^T$ 嘅法線 $\mathbf{n}$,其中 $\mathbf{L}$ 編碼咗有效光源嘅方向同光譜功率:$\mathbf{I} = \rho \, \mathbf{L} \mathbf{n}$。此處,$\rho$ 係表面反照率,對於塗層彈性體假設為常數。
案例研究:評估觸覺感測器設計選擇
當將RainbowSight呢類觸覺感測器整合到機械人系統時,結構化分析框架至關重要。考慮以下非代碼決策矩陣:
呢個框架幫助機械人學家超越單純採用新穎感測器,轉而戰略性地部署佢,令其特定優勢——可定制曲面形狀同基於彩虹嘅穩健光度立體視覺——為整合工作帶來最大回報。
我哋跳過學術表述,直接評估RainbowSight嘅實際影響同可行性。
RainbowSight唔只係另一個觸覺感測器;佢係一個實用嘅工程技巧,優雅地繞過咗曲面光度立體視覺嘅光學噩夢。麻省理工團隊認識到,喺狹窄嘅曲面空間中追求完美、離散嘅多光源設置,對於大規模應用係一場必輸嘅仗。佢哋嘅解決方案?將光「塗抹」成彩虹梯度,然後用校準圖去處理。呢個唔係關於基礎物理學嘅突破,更多係對已知原理(光度立體視覺、顏色編碼)嘅巧妙重新包裝,以大幅提升可製造性同設計靈活性。真正嘅價值主張係可及性。
邏輯鏈令人信服:1) 靈巧操作需要豐富觸覺反饋。2) 豐富反饋來自高解析度3D形狀感測。3) 喺實用(曲面)夾爪幾何上進行形狀感測光學上很困難。4) 先前解決方案(複雜多LED陣列)難以調校且難以擴展/適應。5) RainbowSight嘅創新: 用複雜嘅光譜編碼取代複雜嘅空間光定位。6) 結果:一個更容易以唔同形狀製造、更容易可靠校準,因此更有可能喺實驗室外使用嘅感測器。流程從「點樣令物理原理生效」轉向「點樣令系統可被製造」。
優點:
對於機械人領域嘅研究人員同公司:
RainbowSight係邁向實用高保真觸覺嘅精彩一步。領域內現在應該測試其穩健性,並找到證明其優雅設計價值嘅殺手級應用。
RainbowSight嘅靈活性同高解析度輸出開闢咗幾個有前景嘅方向: