テンソルベース3次元物体認識
ビューベース3Dオブジェクト認識はコンピュータビジョン分野において大きいな課題を取られている。
しかし3次元物体の各々の姿勢の下で見かけ画像は大きい違いがある。
従来の手法は部分空間分析法(アピアランス固有空間分析)法や機械学習法を主に用いて認識を行う。
部分空間分析法は主成分分析や線形判別分析法を用いてコンパクト且つ有効な僅かなパラメーターを抽出し、
このパラメーターによる画像認識を行う。
機械学習手法は主にニューラルーネットワークやサポートベクターマシンを盛んに用いられている。
しかし、これらの手法は何れも先に画像を一つのベクターを表現し、これをより、画像内部に空間的な構造や色空間の関係を失った。
そこで、我々は、画像を一つのテンソルを表現し、画像の空間的な構造や色空間関係を維持するまま、
提案したテンソルベース教師付非線形部分空間法を用いて統計分析し、よりコンパクト且つdiscriminant 特徴を抽出できる。
カラー画像のテンソル表現を図1に示している。テンソルベース統計分析によるビューベース物体認識の概念図を図2に表している。
提案した手法はビューベース物体認識関するベンチーマークデータベースCoil100とETH80を用いて実験評価し、従来の手法により高い認識率を得られた。比較結果は表1に示している。
図1 カラー画像のテンソル表現
図2 テンソル統計分析によるビューベース物体の認識
比較結果
(a)Coil100 データセット
(b)ETH80データセット
発表論文:
(1)Xian-Hua Han, Yen-Wei Chen, Xiang Ruan: Multilinear Tensor Supervised Neighborhood Embedding
(2)Analysis for View-Based Object Recognition. PCM (1) 2010: 236-247