計測・センシングのアルゴリズム
非負値行列因子分解
亀 岡 弘 和
1. はじめに 実世界には,パワースペクトル,画素値,頻度,個数など,非負値で表わされるデータが多い. 主成分分析や独立成分分析などの多変量解析では,所与のデータを複数の加法的な成分に分解することを目的とするが,これと同様に上述のような非負値のデータから構成成分を抽出することが役立つ場面が多い. たとえば,複数の音源の音響信号が混在する多重音のパワースペクトルから個々の音源のパワースペクトルをうまく取り出すことができれば,雑音除去や音源分離などに役立てることができるし,顔画像データを目や鼻などの顔のパーツに該当する画像データにうまく分解することができれば,顔認証や顔画像合成などに役立てることができる. また,文書データ (文書に出現する各単語の個数のデータ)から「時事」や「スポーツ」や「経済」といった潜在的なトピックに該当するような単語ヒストグラムの構成成分をうまく取り出すことができれば,各文書に対し自動インデキシングを行うことが可能となり,文書検索に大いに役立てることができる. 以上のように,非負値のデータを加法的な構成成分に分解することを目的とした多変量解析手法を非負値行列因子分解(Non-negative Matrix Factorization; NMF)1)といい,さまざまな分野で近年注目を集めている. 本稿では,NMF の定式化,基本的な性質,アルゴリズムの導出方法,さまざまな視点からの解釈,おもに音響信号処理の問題に焦点を当てた改良・拡張のアイディアについて解説する. 2. NMFとは 以後,データをベクトルで表記することとする. たとえば,画像データであれば各ピクセルの画素値がベクトル要素となり,パワースペクトルであれば各周波数におけるパワー値がベクトル要素となる. 今,N 個の非負値データベクトル が与えられたとしよう. これらを観測ベクトルと呼ぶ. ただし, は K 次元の非負値ベクトル全体の集合を表わす. NMF では,これら観測ベクトルが,いずれも M 個の基底ベクトルの適当な重みつき和によって表わされたものと見なし,すべての観測ベクトルを最も良く説明するような M 個の基底ベクトルおよび重み係数を推定することが目的である. よって,NMF では加法性が成り立つ量のみが対象となる. 画素値やパワースペクトルはいずれも厳密には加法性が成り立つ量ではないが,NMFを適用する場面では近似的に加法性が成り立つと仮定されているということに注意が必要である. パワースペクトルに対して NMF を適用する上でのパワースペクトルの非加法性についての議論は 6.1 節 で詳しく述べる. 以上の加法性に関する仮定の他に,基底ベクトルと重み係数がいずれも非負値であるという仮定が置かれる点もNMFにおける重要なポイントである. すなわち,NMF は,観測ベクトル を基底ベクトル の非負結合 (結合係数 n が非負値の線形結合) ーーーーーーーーーーーーーーーーーーーーーーーーー ⇒以下、別途 |