馬 景昊 (Jinghao MA) |
博士論文 |
博士学位論文 |
「質的研究における飽和率の測定と知見収集効率化の手法の開発ー自由記述式データを対象にー」 |
本研究は、質的研究における自由記述データの分析において課題となる「飽和率」の正確な測定と、効率的な知見抽出手法の開発を目的としている。 質的研究における「飽和」とは、新たなデータを追加しても新しい情報がほとんど得られなくなる状態を指す。しかし、飽和の判断には明確な基準が存在せず、従来は研究者の主観に依存していた。また、既存の飽和率推定手法は一問一答形式のデータに限定されており、一問複数回答形式のデータには適用が困難であった。さらに、ジップ分布を用いた従来の推定法にはバイアスが含まれることが指摘されている。 加えて、X(旧Twitter)などのSNSの普及により、日常的に膨大な自由記述データが生成・蓄積されているにもかかわらず、そこから有用な知見を効率的に抽出する手法は十分に確立されておらず、いかにして実用的な知見を効率よく分析・抽出するかが重要な課題となっている。 そこで本研究では、以下の三つの課題に取り組んだ:(1) 一問複数回答形式のデータにも適用可能な飽和率推定手法の開発、(2) 飽和率推定におけるバイアスの修正、(3) 自由記述データからの効率的な知見抽出手法の提案である。 まず、研究1では、一問複数回答形式のデータにも対応可能な新たな飽和率推定手法を開発した。具体的には、参加者の回答プロセスを被復元抽出過程と仮定し、ジップ分布に基づく尤度関数を構築した。その結果、飽和率の計算が一問複数回答形式のデータにも対応可能であるため、より幅広い質的研究への応用が可能となった。 研究2では、Approximate Bayesian Computation(ABC法)を用いて飽和率推定におけるバイアスの修正を試みた。従来の方法では、知見の順位を頻度情報から近似的に推定していたためにバイアスが生じていたが、ABC法により順位情報を用いずにシミュレーションベースで母数推定が可能となり、推定の精度が大幅に向上した。 研究3では、大量の自由記述データから未知の知見を効率的に発見するための手法として、セマンティック・テキスト類似性(STS)を導入した。STSによって、新たな知見と既存の情報との意味的な類似度を算出し、意味的に新しい情報を優先的に抽出する方法である。日本語および中国語のデータセットを用いた検証により、本手法の高い効率性が実証された。 これらの研究成果により、自由記述形式のデータに対する飽和率の推定は多様なデータ形式に対応可能となり、推定精度も向上した。さらに、知見抽出の効率化によって研究資源の有効活用が促進され、質的研究における信頼性と効率性の向上が期待される。結果として、幅広い分野で応用可能な有効な手法が提示されたといえる。 |
jinghaom[アットマーク]fuji.waseda.jp Last update: 2025-04-23 |
Back to Doctoral students List |
Back to Member List |