SEM_R

  【編著者】
   豊田秀樹・編著 (2014年4月)
   東京図書

  【執筆者】
  室橋弘人,齋藤朗宏,中村健太郎,川端一光,福中公輔,
  岩間徳兼,久保沙織,鈴川由美,池原一哉,大橋洸太郎,
  秋山 隆,拜殿怜奈


 

 本書は, 共分散構造分析(CSA, Covariance Structure Analysis), あるいは構造方程式モデリング(SEM, Structural Equation Modeling)とよばれる数理統計的手法を, 統計解析環境Rにおけるパッケージlavaanと, その関連パッケージを用いて徹底的に使いこなすための解説書です。全くの初心者の方から, SEMの上級者の方まで利用していただけるように内容を構成しています。本書に登場するデータとスクリプトは全て, 東京図書Webサイトの本書の紹介ページで配布しています。入手して学習に役立ててください。卒業論文などで, 期限内に共分散構造分析をすることを迫られている読者の方は, 第1章と第2章だけを読んでください。ユーザーに徹するなら第1章と第2章だけで共分散構造分析ができます。数あるSEMのツールの中からRを選び, Rパッケージの中からlavaanを選んだのは, 以下の3つの理由のためであり, 現時点でlavaanはSEMを実行するためのベストの選択です。

 ・GUIでないから
パッケージlavaanはグラフィカル・ユーザー・インターフェース(GUI)ではありません。しかしGUIでないという性質はとても重要です。編著者はSEMに限らず, 企業から依頼を受けて, しばしばデータの分析をします。しかしその際, GUIのソフトウェアを使用しません。もちろん共分散構造分析をする際にもGUIのソフトウェアは利用しません。GUIでは研究・仕事にならないからです。
企業における分析は, 性別や地域や年齢区分や年度やモデルや, その他諸々の条件を変更して, それらの積の勢いで増える何十枚, 何百枚という図や表を作らねばなりません。GUIだと図表を作るたびにクリックをしなければなりません。1枚1枚図表を作らねばならないということです。しかしRを使用すれば, 入出力ファイル名の生成をも含めて何十枚, 何百枚という図や表を自動で作成できます。若くもない編著者が企業から分析依頼を受け, 何百枚も分析図表を作成できるのは, GUIを使っていないからです。
ときどきデータ解析の授業を持たれている先生が「RはGUIでないから, 学生が可哀そうで, 授業で使いづらい」という主旨のことをおっしゃることがあります。しかし多くの学生は, 卒業後に企業に就職します。現代社会におけるbigデータを扱う企業内で, GUIで1枚1枚分析図表を作成していては勝負になりません。時間の浪費です。可哀そうなのは, むしろGUIでデータ解析の授業を受けたしまった学生です。

 ・オープンソースだから
統計解析環境Rは実質的に無料です。何万円, 何十万円とする統計解析ソフトウェアの請求書を見て, オカシイと思ったことはありませんか。ほとんど進歩していない商品のバージョンアップ料を請求され, 少し前のソフトのサポートを打ち切られたことはありませんか。鋼鉄を使用し, 多くの部品から構成される工業製品とは異なり, ソフトウェアは知識の集合体です。実体ではなく知識に値段がついています。しかし統計解析ソフトを支える99.9%以上の知識は, 当該企業とは無関係の研究者によって生産・提供されたものです。ソフトウェア会社が付け加えた僅かばかりの知識への対価として, 商用の統計解析ソフトの現行の値段は高すぎます。
ピアノの腕前を上げるためには, 自宅にピアノがあったほうが有利です。自宅にピアノがなく, 大学にだけあったのでは上達は遅くなります。野球をするなら自宅にグローブを持っていたほうが有利です。同様に, 統計分析の技能を向上させるためには, ツールを手元に置いて, 自由な時間にふんだんにツールに触れることが効果的です。楽器やスポーツの鍛錬と同じです。このためには無料のソフトで統計教育を行うことが本質的に重要です。大学に来たときにだけ統計分析ができるのではなく, 学生ひとり一人が, 自身のPCにインストールし, 好きな時に思う存分使えるような環境を整えることが肝要です。

 ・オブジェクト指向だから
パッケージlavaanは, Mplusという非常に完成度の高いSEMの商用ソフトを目指して開発され, 現在も開発が続いています。それはR自身がSを目指して開発されたことと似ています。ただしlavaanが目指しているのは, Mplusの分析性能であり, Mplusの文法や設計思想ではありません。分析性能に関しては, lavaanは初等中等レベルに関しては申し分なくMplusを再現しています。分析結果は厳密で正確です。
ただし文法や設計思想に関しては, 圧倒的にlavaanがMplusに勝っています。Rのパッケージであるavaanは, 当然, オブジェクト指向です。SEMの出力はしばしば大部になりますが, それらはオブジェクトにカプセル化され, 必要に応じて利用されます。分析結果は直ちに他のRの機能で処理できます。統合的なデータ解析環境としては, 無料のlavaanのほうが有料のMplusより圧倒的に快適です。
またlavaanは構造化されていますから, 関数の中身を不問にして, 機能を拡張することが可能です。semToolsや, semPlotや, lavaan.surveyや, simsemなどのパッケージや, Onyxはそのようにしてlavaanに機能を提供しています。よってたかって多勢に無勢で開発が進みますから, 分析性能も早晩, 有料のMplusを無料のlavaanが追い越すでしょう。

 本書を企画する際に, 最後まで悩んだのは, パス図をどうするかという問題でした。そして我々は以下のように結論しました。SEMの中でパス図は, 分析者が(1)分析モデルを特定するため, (2)分析結果を提示するため, という2種類の役割をもっています。

 ・分析モデルの特定に
分析者がパス図を描くと, そのモデルを特定し, lavaanのコードを生成するOnyxというフリーのソフトウェアがあります。Onyxとlavaanを連動させれば, 分析モデルをパス図で特定させることができます。Onyxによるパス図描画の完成度は高く, 市販のSEMソフトよりも美しく描くことができます。本文の中でもOnyxの入手法と描画法を紹介しています。
しかし本書では, そのやり方をメインに据えての解説はしていません。分析者は, もちろん, パス図を頭に想い描いて分析をするのですが, 慣れると頭の中のパス図のイメージをスクリプトで直接指定したほうが断然早いし, 容易だからです。意外に思われるかもしれませんが, 編著者は, 実際に研究をする際にパス図の作図機能を使ってモデルを特定したことはありません。実践的にSEMによって分析を進めるとは, そういうことです。
パス図のイメージをスクリプトで直接指定するのはタッチタイピングに例えられ, わざわさ実際にパス図を描いてモデルを特定するのはキーボードを見ながら文字を打つことに例えることができます。モデル探索のためには, 何十, 場合にはよっては百以上のパス図を計算しなくてはなりませんから, 実際に一つ一つパス図を描いてモデルを特定するのは非効率だし, 非常に煩雑です。ここは是非, パス図のイメージを直接スクリプトで指定できるレベルを目指しましょう。

 ・分析結果の提示に
分析結果を論文やレポートで報告する場合には, パス図を使うことが必須です。こちらは省略不可能です。lavaanの分析結果はパッケージsemPlotで描画することが可能です。ただし現時点ではsemPlotは完全ではありません。モデルによっては図が重なりあうことがあり, 最終報告に使用できない場合もあります。その際には, Onyxやオフィス等の描画機能を使って, 第20章で示すように報告用のパス図を描いて下さい。報告のための最終的なパス図は, 通常は数枚程度に収まりますから, モデルの特定と比べると大した手間ではありません。

 本書の内容について簡単に紹介いたします。卒業論文で共分散構造分析をすると決めた御用とお急ぎの方は, 第1章と第2章だけ読んでください。第1章では, データ解析の入門的内容が, 第2章ではSEMの速習の内容が展開されています。 修士論文や各種レポートで共分散構造分析をする必要のある方は, 前2章に加えて第3章と第4章も合わせて読んでください。第3章では様々なモデルが紹介され, 第4章では共分散構造分析の詳しい解説が加わります。 第5章から第19章では発展的な話題を扱います。必要な部分をお読みください。内容は, 平均構造分析(第5章), 多母集団分析(第6章), カテゴリカル変数の分析(第7章), テスト理論(第8章), 検定力分析(第9章), 複雑な調査計画(第10章), ブートストラップ(第11章), 成長曲線モデル(第12章), 潜在交互作用モデル(第13章), 適合度指標(第14章), ミッシングデータ(第15章), 各種推定法(第16章), ADFによる単回帰法(第17章), ADFによるパス解析法(第18章), OpenMxを用いた分析法(第19章)という構成です。 第20章では, 我が国で発表されたSEMの優れた実践研究の紹介をします。論文・レポートで分析を成功させるヒントが散りばめられています。日常生活者の視点で大胆にその研究の動機や着眼点を紹介しました。それぞれの要約に合わせた形でパス図も執筆者が書き直しました。付録では, フリーソフトOnyxの紹介をしています。
無料のソフトウェアでSEMの分析を行うことが, 当たり前に, そして標準になるために, 本書が少しでも貢献できたなら幸いです。(本書まえがきより)

 

目次
第1章 共分散構造分析前夜
第2章 速習共分散構造分析
第3章 さまざまなパス図の描画
第4章 上級者を目指して
第5章 平均共分散構造分析
第6章 多母集団同時分析
第7章 カテゴリカル変数の分析BR> 第8章 テスト理論
第9章 検定力分析
第10章 大規模調査のSEM
第11章 ブートストラップ法
第12章 SEMの下位モデルとしての成長曲線モデル
第13章 交互作用モデル
第14章 適合度指標
第15章 欠測値の取り扱い
第16章 推定法
第17章 3次積率を利用した単回帰分析
第18章 3次積率を利用したさまざまな2変数モデルの分析
第19章 OpenMxを用いた共分散構造によるモデルの特定
第20章 応用研究紹介