福中公輔(Kosuke FUKUNAKA)
博士論文

博士学位論文

「SEMを利用した新しい探索的データ解析法の開発」


 構造方程式モデリング(SEM)は数理的に一般的な形式で表現されているために,様々な経緯で提案されてきた複数の統計モデルを,その下位モデルとして含むことが可能であるということはよく知られている。一方,グラフィカルモデリング(GM)はSEMとは異なった経緯で提案・発展してきた変数間の因果関係をモデル化する統計的手法であり,変数間の仮説が少ない場合に有効な知見を与える探索的分析法として注目されている。
 本研究の目的はこのGMをSEMの枠組みに統合し,それをさらに発展させて,これまでSEMが不得意としていた探索的分析法に対して,SEMを利用した新しい方法論を提案することである。

 第1章では探索的データ解析(EDA)の特徴を振り返りながら,SEMでEDAを実践するための先行研究について考察した。まず始めにEDAの特徴として,渡部・鈴木・山田・大塚(1985)により重要と言われている「抵抗性」「残差の分析」「再表現」「図示」の4つの基本的な概念について解説した。次に探索的因子分析の詳細をまとめ,それをSEMに融合させた近年最も新しい分析手法の1つである探索的構造方程式モデリング(Exploratory SEM;以下ESEMと略す)と呼ばれる手法の考察を行った。その際,実データを用いてESEMに適用し,その有効性を検証した。

 第2章では,EDAにおいて使用される,代表的な機械学習の手法について解説を行った。具体的にはGMを取り上げ,それらの手法の仕組みや意義を詳細に検討した。  GMは有向グラフのみで表現されたベイジアンネットワークと無向グラフのみで表現されたマルコフ確率場の2つに大きく分けることができる。このうちベイジアンネットワークは変数間の影響関係をモデル化できるので,そこから得られる知見はきわめて有効であるが,変数の増加に伴い,探索空間が爆発的に広がり,計算量が飛躍的に増大してしまう。共分散選択を利用することで計算量は減少するが,その場合,すべての変数間に順序関係が必要となってしまうため,実践場面で有効に活用するためには現実的でない。
 一方,マルコフ確率場は変数間の空間的対称性を明らかにでき,変数の直接的な関係性を論じる上できわめて有効な知見を得ることができる。特に,人文社会科学系で取り扱うような,変数の数が少ないような場合には,共分散選択を利用することで簡便にモデル探索を行うことが可能である。
 しかし,ベイジアンネットワークとマルコフ確率場の双方に共通して言えることは,どちらも観測変数のみに対してしか対応していないということである。心理学をはじめとした人文社会科学系の分野では,直接的には観測できないものを扱う必要があるという性質から,潜在変数を利用してモデルを構成することがよくある。そのため,GMが心理学系の研究分野で利用されることは少なかった。この点,すなわち潜在変数に対してモデル探索を行うことができないという点が,GMにおける最大の問題点である。

 第3章の目的は,『@SEMにおける共分散構造の枠組みでGMの数理的アイデアが表現できることを理論的に示すこと』『ASEMによる分析結果の数値が,日本品質管理学会テクノメトリックス研究会(1999)の数値例に一致することを確認すること』『B当該ソフトウェアのマニュアルには載っていない実行方法を解説し,実践の便宜に供すること』の3点である。
 GMにおいて「モデル比較」というと,観測変数間にパスが引けるか引けないかという,共分散選択に基づくモデルの比較を意味している。しかし統計学には,因子分析モデルやパス解析モデルを始めとした,様々な統計モデルが存在するわけであり,これらの各種モデルとGMによるモデルとを比較することはきわめて重要であると考えられる。つまり,あるデータにGMを適用するのなら,そのモデルが他の統計モデルよりも最適であると判断できる根拠が必要であるということだ。  しかしこれまでの多くの研究では,これら各種モデルとGMとを客観的指標に基づいて,正しく比較されることはなかった。これは,そもそもGMという分析手法が多くの尤度モデルに基づく分析手法と根本的に異なるものであると考えられていたため,仕方のないことでもある。  しかし本章での研究により,GMもSEMの枠組みで解くことができ,構造方程式モデルの下位モデルに含めることが可能となった。これはすなわち,当該データに対してGMを適用するのが良いのか,あるいは因子分析モデルやパス解析モデルなどを適用するのが良いのかを,適合度という客観的基準を用いて,同じレベルで比較可能になったということである。
 また,GMのもう一つの特徴として,これまでの研究ではほとんどの場合において観測変数のみに対してしか適用されてこなかったというものがある。しかし,本研究によってSEMと融合されたことにより,潜在変数に関してもより柔軟にGMを適用できる可能性が開けた。このように観測変数を主な対象としていたGMを,それと同レベルの水準で潜在変数への適用の可能性を広げたことは,応用可能性という面で非常に有用だと考えられる。

 第4章では因子分析と因子間のGMを同時に行う共通因子構造解析と呼ぶ方法を提案する。適用例では,この方法を用いて因子間の相互関係を明らかにし,偏相関とクリークを基にして,因子間の対称的関連を考察する。
 本研究における最初の2つの適用例では,因子分析研究において有名な相関行列を用いて,因子の抽出とそのGMを同時に行った。その結果,ここで利用した2つの先行研究が,人も時代も全く異なっているにもかかわらず,類似した構造を確認でき,知能全体に関する1つの仮説を獲得するに至った。一方3つ目の適用例に関しては,不適解が発生したために共分散選択が途中で停止し,完全な形で因子間の相互関係を明らかにすることができなかった。しかしこの結果は,今後の研究の土台として役に立つ,因子間関係の暫定的な構造になりうると考えられる。
 一般的にGMのマルコフ確率場モデルにおける辺の有無は,通常のSEMにおける双方向パスの有無には直接的には対応しない。しかし,本研究で開発した手法でGMを実施することにより,因子間の関連構造のより深い考察に役立つ情報を得ることができる。これが本研究においてマルコフ確率場モデルをSEMの枠組みに導入した最大の特徴である。
 GMはデータから探索的にモデルを構築していく手段として非常に優れた手法である。これは研究仮説に基づくとは言え,ある程度恣意的にパスを引く必要があるSEMにはないモデル構成手段である。もちろん心理学の研究において研究仮説の重要性を否定するものではない。しかしその仮説の正しさをデータの側から検証できるGMは,モデル探索という観点からSEMにとって非常に有効な手段の1つになると考えられる。このような点から見てもGMをSEMの枠組みで表現したことの意義は大きい。

 第5章では,共分散選択によるGMを利用して,研究当初に仮定した構成概念の意味を再解釈せず,かつデータからの明確な理由でモデルを改良するための独自因子構造解析という新しい探索的アプローチを提案する。
 これまで,因子分析モデルの改良に関して,因子数を変更したり,因子から観測変数へのパスの数を変えたりする方法は多くの研究で散見されてきた。しかしこれらの方法を採用した場合は,仮定した構成概念の意味自体が変質してしまうため,抽出した因子の再解釈が必要となる。これにより,研究初期に仮定したモデルとは大きく異なったモデルが得られる場合もあるだろう。このため研究の方針や目的を変更せざるを得なくなる可能性がある。
 ただし,モデルの試行錯誤を経て新たな問題に気づいたり,優れた着想を得ることもあるので,モデルを大きく変更することがすべての場合において誤りというわけではない。しかし研究している問題の種類によっては,当初のモデルを大きく変更することなく分析を続行したい,あるいはそうせざるを得ないこともある。このような場合に本研究で提案したアプローチは非常に有用である。
 一方,分析の結果に基づいてモデルの考察を行うとき,これまでは共通因子の解釈や因子パタンについては深く考察されてきたが,独自因子に対する考察はあまり行われてこなかった。これは独自因子が,「共通因子では説明できなかったその他すべての要因」という解釈しづらい性質を帯びているためだと考えられる。しかし本研究で提案した独自因子構造解析という手法は,独自因子間の直接的な関係を見いだすことが可能なため,共通因子では説明できない要因とその関連構造の発見のためにも,ひいては新しい因子を発見するという目的にも利用することが可能である。
 このため本手法は,SEMにおける新しい探索的分析法となりうる。このように本研究で提案したアプローチは,モデルの改良や独自因子における考察,そして新しい知見の発見といった,データ解析における多くの状況で利用できる極めて有効な手法であるといえる。

 本論文では,一貫して機械学習におけるGMを統計学におけるSEMに融合するための方法論及び数理的枠組みの提案を行ってきた。これは確認的データ解析の用途として用いられることが多かったSEMに対して,探索的データ解析として使用するためであり,SEMにおける新しいアプローチであると言える。
 本論文ではまず共分散選択を利用した古典的なGMをSEMの下位モデルとして表現した。これにより観測変数のみを使用したGMは,SEMのソフトウェアを用いて完全に分析可能であることが明らかとなった。次に,GMをSEMの枠組みで表現できたことを利用して,潜在変数間に対してもGMが適用可能であることを示した。ここでは確認的因子分析モデルにおける共通因子に対して共分散選択によるGMを実行し,共通因子間の構造を探索することを目的としている。その結果,研究仮説が少ないような場合でも,素早く共通因子間の関係性を明らかにすることができ,かつ優れた考察や気付きを得ることができた。ここで提案した方法を共通因子構造解析と呼ぶ。
 最後に,潜在変数の中でも特に独自因子に対してGMを適用するための方法論を提案し,よりよいモデルを構築するための構造探索に利用する手段を開発した。この手法を独自因子構造解析と呼ぶ。独自因子構造解析では共通因子の構造を維持したままモデルを改良するための方法を提供することを目的としている。しかし,独自因子間に強い構造が見受けられるなど,初期モデルが著しく不適な場合などには,どのようにモデルを修正すべきかの見通しを与えてくれる。このように独自因子構造解析は,モデル修正のための副次的な効果も得られる極めて柔軟な探索的解析法である。
 これら3つの分析法は,それぞれに独自の役割があり,分析のための目標を持っている。例えば,通常のGMは観測変数間のみの構造の探索を目的としており,潜在変数間の構造探索には活用できない。一方,共通因子構造解析は,潜在変数の中でも特に共通因子間の構造探索に使用でき,共通因子の相互の関係性から研究対象に対する深い考察と洞察を目標としている。また,独自因子構造解析は,潜在変数の中でも特に独自因子間の構造探索に活用でき,初期モデルを維持したままモデルの改良を行ったり,あるいは初期モデルの修正における方向性の把握を目標としている。
 これらの手法はそれぞれが有用ではあるが,3つの手法を相互に組み合わせることでさらに有益な分析体系として確立することができる。この3つの手法を一連の流れとしてまとめた,SEMおよびGMを利用した探索的分析法の手続きがグラフィカル構造方程式モデリング(GSEM)である。

fukunaka[アットマーク]uca-works.com
Last update: 20120325