連携研究者: 韓先花(立命館大学情報理工学部研究員)
健山智子(立命館大学情報理工学部助手)
古川顕(首都大学東京教授)
金崎周造(滋賀医科大学)
・研究目的:
医用画像は、一般の画像と異なって空間的に3次元情報を持ち、さらにX線やMR, PETなど異なるモダリティ情報を持つ。
このような膨大な多次元データからいかに重要な情報(コアとなる情報)を見つけることは、計算解剖学において重要
な課題である。
我々は、これまで多重線形理論の枠組で多次元データを一つのテンソルとして効率よく記述及び処理する手法
に関する研究を行ってきた。その中では、一般化N次元主成分分析
法(GND-PCA: Generalized N-Dimensional Principal Component Analysis)を開発し、世界に先駆けて計算解剖学
に応用し、臓器の統計ボリュームモデリングを構築した。従来の主成分分析や判別分析法等に比べ、多重線形解析法において
は、多次元データをベクトル化する必要がなく、そのまま処理•解析ができる。空間的幾何学構造をそのまま保つことができ、
少数なサンプルからも汎化能力の高い統計モデルを構築することができる。本プロジェクトでは、これまでの成果を基盤に、新たに線
形テンソル符号化法(Linear Tensor Coding: LTC)を開発し、計算解剖学への応用の体系化を目的とする。LTCは先行の
GND-PCAと違って、多次元データを特徴的なパターン(特定な意味•効果)をもつテンソル基底の線形結合として表現す
ることができる。各基底の解析により病気に寄与する成分の特定が期待できる。また、計算解剖学への応用では、以下の
二つの応用を試みる。(1)臓器のボリュームデータを一つ3次テンソルとして取り扱い、LTCを用いて形状とテキスチャの
バリエーションを同時に記述できる統計ボリュームモデルを構築する。(2)様々な特徴(特に局所的特徴)を一つのテンソル
として融合し、各特徴から同時に有効な成分を選択できる手法を確立する。
・研究の概念図:
我々の先行研究では、多重線形解析は医用画像の統計モデリングと解析に有効であることを示してきた。ベースになって
いる手法はGND-PCAである。GND-PCAは高次特異値分解(High Order SVD)に基づいて行われたものである。
N次元データ(Nth-order Tensor)は、図1(a)に示すようにコアテンソルと各モードの固有空間のテンソル積に分解される。
そのコアテンソルは多次元データの特徴として用いられるが、大域的な特徴しかなく、多次元データに混在する特徴的
なパターン解析(モード解析)はできない。本プロジェクトでは、GND-PCAをさらに拡張し,図1(b)に示すように多次元
データをいくつかのテンソル基底の線形結合として表現できる線形テンソル符号化(Linear Tensor Coding: LTC)を
開発する.LTCでは、それぞれの基底は特徴的なパターン(特定な意味•効果)をもつ基底となるので,基底の係数はそれ
らの特定効果の尺度として用いることができる.病気の特定や診断支援が期待できる。全体の研究概念図が図2に示している。
図1 (a) GND-PCA; (b) LTC
図2 研究の概念図
・研究の流れ: 1. 線形テンソル符号化法(Linear Tensor Coding: LTC)の開発:
我々の先行研究で開発した一般化N次元主成分分析法では,少数サンプルからも汎化能力をもつ統計モデリングを構築する
ことができた. 本プロジェクトでは、先行研究で開発したGND-PCAを基盤に、新たに多次元データを特徴的なパターン
(特定な意味•効果)をもつテンソル基底の線形結合として表現できる線形テンソル符号化法を開発する。
そのイメージ図を図3に示す。 図3 線形テンソル符号化の流れ図
LTC理論開発では、図3(a)に示すように、まず入力テンソルからGND-PCAでランク1テンソル基底
(第1基底)を求め、次に残差テンソル(入力テンソルと再構成テンソルとの差)から第2、第3、などの基底を階層的
に求めていく。残差テンソルのノルムがある閾値r(近似精度を表すパラメータ)より小さくなるまで高次の基底
を求めていく。入力テンソルは、図3(b)のように、テンソル基底 の線形結合で表される。
2. LTCによる統計ボリュームモデリング:
観測された医用ボリュームデータには,形状の変化とテクスチャ(濃淡分布)の変化を同時に解析する必要がある.
本プロジェクトでは,図4に示す形状とテクスチャ(濃淡分布)のバリエーションを記述できる統計ボリュームモデルを提案
する.本モデルにおいては,ボリュームの形状とテクスチャ(濃淡分布)を分けてそれぞれ統計モデルを求める手法である.
図4 統計ボリュームモデリングの流れ
3. 局所特徴量の融合と選択:
医用画像から肝疾患を識別するには、テキスチャ(濃度値分布)特徴量が非常に重要である。
近年、一枚の画像から抽出した大量な局所的なSIFT特徴を量子化し、予め用意したVisual-Wordsのヒストグラムとし
て表現するBag of Features (BOF)を提案された。この手法はある程度良いパフォーマンスを得ているため注目されている。
しかし、BOFで局所的なSIFT特徴は予めに用意したVisual-Wordsを用いて近似し、識別に有効的な情報を失う可能性がある。
本プロジェクトでは、抽出した局所的なSIFT[Lowe, 2004]特徴を量子化では無く、一つのテンソルとし
て取り扱い、統一的に記述・融合する手法を提案する。そして、開発したLTCを用いることにより、膨大なSIFT特徴量から
コアとなる有効な特徴を選択することができる(図5).
図5 線形テンソル符号化法(LTC)による局所特徴量の融合と選択
・関連研究発表:
本プロジェクトは図2に示すように四つの研究テーマについて研究を進めていく:①多重線形代数を基盤とする線形テンソ
ル符号化法(LTC)の理論開発;②LTCを用いた臓器の統計ボリュームモデリングの構築を行う;③様々な特徴(局所的特徴)
の融合とLTCによる各特徴から有効成分の選択;④肝疾患の識別への応用について研究を行う。