早稲田大学文学部文学研究科
豊田研究室

HMC法によるベイズ統計学の導入と実験データの分析 ―t検定・分散分析からの卒業―

全体要旨

有意性検定は,心理学研究の方法論として各方面から批判されています。有意性検定を禁止する学術誌すら登場しています。ではどうしたらよいのでしょうか?本シンポジュームでは,ベイズ統計学への移行を主張し,t検定・分散分析の具体的オルタナティヴを示します。まずベイズ統計学をまったく知らない方を対象にチュートリアル的解説をします。続いて心理学の研究で必須の,平均値の差の推測に焦点をあて,ポスト分散分析の具体的な方法について解説します。実験計画法は,R.A.フィッシャーが創始した学問です。フィッシャーは,ベイズ統計学を完全否定していました。ここでは実験データをベイズ統計学に基づいて分析する方法を論じます。たとえるならば,マルクスの資本論をアダム・スミスの神の見えざる手で解説するという主旨になるのかもしれません。実装はハミルトニアンモンテカルロ(HMC)法を用い,その基本概念に関しても解説いたします。

心理統計学の初年度の授業をベイズ統計学で行うことは可能か

チュートリアルの流れをキーワードで示すと以下となります。ベイズの定理・検診問題・ベイズ更新・迷惑メイルフィルタ・主観確率・血液鑑定問題・私的分析/公的分析・ベイズの定理の第3の使用法・カーネル/正規化定数・正選手問題・事後分布の評価・無情報的事前分布・マイノリティ差別・波平釣果問題・予測分布・事前分布の設定・3囚人問題の正解は1/2でよい・2群の差に関する推測・1要因分散分析・2要因分散分析。

豊田 秀樹(早稲田大学文学学術院)

事後分布からのサンプリング

ハミルトニアンモンテカルロ法における更新回数とステップサイズを自動的に決定するNUTS法(No-U-Turn Sampler)について紹介します。NUTS法はstanに実装されているサンプリング方法です。はじめに,更新回数の停止基準とスライスサンプリングについて解説し,次いで候補点の作成とサンプリングについて説明します。続いて,確率的最適化によってステップサイズを決定する方法について解説します。

池原 一哉(早稲田大学グローバルエデュケーションセンター)

ベイズ統計学による「研究仮説が正しい確率」の計算 ―p値からの卒業―

全体要旨

ベイズ統計分析に,ハミルトニアンモンテカルロ(HMC)法を組み合わせたデータ解析の具体的方法を初心者の方に解説します。特に生成量に着目し,さまざまな場面にける問題解決の様子をお見せします。HMC法と生成量を組み合わせは極めて強力であり,ほとんど制限なく様々な分布の位置や差に関する考察が可能になります。分析の可能性を広げるために,是非,生成量の使い方をマスターしてください。分析の一番の特徴は「研究仮説が正しい確率」を直接的に計算することです。この確率こそ,データ分析者が(そして研究者が)論じたい確率です。伝統的な統計学で計算されるp値は「帰無仮説が正しいと仮定するとき,手元のデータ以上に甚だしい状況が生じる確率」です。しかし,これは二階から目薬的な,もってまわった分かりにくい確率です。伝統的な有意性検定の枠組みでは,「研究仮説が正しい確率」は決して計算できません。もうp値からは卒業しましょう。

Stanによるサンプリングの実行

HMC法を実行するためのソフトウェアStanおよび統計解析環境R上においてStanのためのインターフェイスを提供するパッケージであるRStanについて解説します。Stan言語を用いることで,研究者は柔軟に自身のモデルを構成することが可能となります。また,生成量を定義することで,「研究仮説が正しい確率」を,統計量を構成することなく検証できます。研究仮説の具体例を挙げて,それをStan言語で表現し,StanをR上から実行する方法を示します。

秋山 隆(早稲田大学文学学術院)

正規分布に関するベイズ的推測

正規分布の平均と分散,分位数,そして独立な2群の平均値差について,ベイズ統計学的なアプローチによる推測の方法を示します。例えば,正規分布の平均に関する推測においては,適切に生成量を定義することで,母平均の値がある値より大きくなる確率を,直接手元のデータから推測することが可能です。「研究仮説が正しい確率」を生成量としてどのように定義し,解釈するのかについて,具体例を通して紹介します。

久保 沙織(早稲田大学グローバルエデュケーションセンター)

伝統的な統計学の推測統計ではあまり注目されることのなかったポアソン分布や幾何分布のような正規分布以外の6種類の分布について,ベイズ統計学的なアプローチによる推測方法を紹介します。例えば,2 つのポアソン分布の母数の差を推測する例では2母数の確信区間,2母数の差の確信区間だけではなく,伝統的な統計学では推測できない,一方の母数が大きくなる確率を加えた3つの観点から考察しベイズ統計学の利点を示します。

磯部 友莉恵(早稲田大学大学院)

本発表では,比率に関する推測,相関に関する推測,信頼性に関する推測に関して紹介します。比率に関する推測では,比率の差,リスク比,オッズ比について扱います。相関に関する推測では,相関係数の差に関する推測だけではなく,切断効果および切断効果の補正に対するベイズ的アプローチに関して紹介します。また,信頼性に関する推測では,信頼性の指標の一つである級内相関と,一般化可能性係数を扱います。。

拜殿 怜奈(早稲田大学大学院)

チュートリアルの流れをキーワードで示すと以下となります。収束判定指標Rハット・マルコフ連鎖における初期値依存・多重連鎖・StanにおけるRハットの算出・連鎖間分散と連鎖内分散を用いた不偏推定量の導出・非効率性因子・系列内相関がある標本の分散の導出・非効率性因子の推定法・Effective Sample Size・系列内相関の推定法・StanにおけるEffective Sample Sizeの算出・波平釣果問題の事後予測分布による解の導出・積分計算におけるカーネルと正規化定数の関係

長尾 圭一郎(早稲田大学大学院)