【編著者】
豊田秀樹・編著(2015年5月)
東京図書
【執筆者】
久保沙織,秋山 隆,池原一哉,拜殿怜奈,
長尾圭一郎,磯部友莉恵,吉上 諒
本書では,Googleフォームを利用してWeb上でアンケート調査を実施し,統計解析環境Rを用いてアンケートデータを分析する方法を解説します。どちらも無料で利用できるツールです。読者対象としては,アンケート調査をする必要に迫られた大学生,数学Iの「データの分析」を学習した高校生,高等学校の数学の先生,大学で入門的な統計学の授業をしている先生です。
これまでアンケート調査(質問紙調査)で卒業論文を書こうとすると,(1)調査票を印刷し,(2)調 査票を配布し,(3)調査票を回収し,(4)データを入力し,(5)調査票を注意深く保管・廃棄する必 要がありました。しかしウェブ上でアンケート調査を実施すると,これらの労力は大幅に省略また は軽減でき,調査の本質的・知的作業に時間や労力を集中できます。(1)紙媒体の調査票を印刷する 必要がありません。費用・森林資源を節約できます。アンケート実施のギリギリまで調査票を推敲 できます。(2)調査票を配布する必要がありません。メール等でURLを通知し,回答を依頼できま す。(3)調査票を回収する必要がありません。遠方・海外に住んでいる人にも回答してもらえます。 (4)調査票を見て,PCへデータを入力する必要がありません。楽だし,転記ミスがなくなります。 (5)紙媒体の調査票を保管・廃棄する必要はありません。 調査が終了したら,集計・分析をします。ウェブ上には無料の解析ツールもありますが,本書で は2つの理由から統計解析環境Rを使ってアンケート調査のデータを手元のPCで分析します。1 つは,ウェブ上の解析ツールよりRは圧倒的に高機能だからです。もう1つは,仮に匿名であって も,調査データをいつまでもウェブ上に置くべきでないからです。収集後は,速やかにウェブ・ゥら データを・Eリり離し,流出しないように責任をもって管理してください。
この本には数学I「データの分析」で習った内容を元にして,アンケート調査を行う方法が書いて あります。仲間の意見のとりまとめや,クラス選挙や,自由研究などに利用してください。高校数 学I「データの分析」の学習内容は,第5章と第6章の前半に書かれています。第5章では,1変量 の分析が説明されます。この章の学習内容は全て「データの分析」で習った内容です。第6章では, 2変量の分析が説明されます。この章では相関関係が中心に解説されます。しかしここでは標準化という「データの分析」では習わない知識が付加されます。アンケートの結果を解釈するためには 必要な知識ですから,是非,理解してください。またクラメールの連関係数・残差分析という高校 数学では習わない内容も登場します。こちらは数理的なしくみを理解する必要はありません。アン ケート調査はとっても楽しいですよ。 第7章,第8章の内容も数理的なしくみを理解する必要はありません。たとえば,みなさんが日 常的に使っているPCや冷蔵庫やテレビの原理はとても複雑で,そのしくみを完全に理解すること は困難です。でも使い方が分かればとても便利です。「冷蔵庫はどうやって食べ物を冷やすんだろ う」という冷却原理が分からなくても冷蔵庫は普通に使えます。アンケート解析技法もそれと同じ です。必ずしも原理は分からなくてもいいのです。道具としてどのように使うのか,どのように結 果を読み取るのかだけに注意して,これらの技法の使い方をマスターしてください。
数学Iを構成する章の中で「データの分析」は,「数と式」「2次関数」「図形と計量」「集合と論 証」など他の章と比較して異質です。「データの分析」はマイナーであるとの印象を持たれることも ありますが,それは間違った印象です。なぜなら高等学校を卒業したのち,2次関数や図形や集合 の知識は,必ずしも必須の知識ではないからです。はっきり言ってしまえば,それらと全く関係の ない人生というものを容易に想像できます。それに対して「データの分析」は,内閣支持率・選挙 予測・世論調査・視聴率調査などの理解に深く関係します。「データの分析」抽象的な数学ではあり ません。世論へのアンテナとして,日常生活・ニは切って・熕リれない実用的な学習内容なのです。 「データの分析」はアンケート調査を実習することによって,小学校における総合学習にも似た 知的な体験を提供してくれます。質問文作成の奥深さは文章力を鍛える国語のよい学習となります。 アンケートのテーマとして時事問題の賛否を問えば生きた社会科の勉強になります。アンケートが 成功するか失敗に終わるかの首尾は,理科実験に通じる企画実行の体験になります。これまでの数 学とは根本的に異なっています。本書を利用し,是非,教室の中でアンケート調査の実習をしてく ださい。
現在,高校生は数学I「データの分析」の中で以下の知識を学んでいます。
度数分布表(離散変量・連続変量・度数・相対度数・階級値・階級幅・外れ値・5数要約・度数分布多角形・累積相対度数・単峰性・多峰性),
代表値(平均値・調和平均・相乗平均・中央値・最頻値・仮平均・最大値・最小値・偏り(歪み)・抵抗性),
散布度(分散・標準偏差・四分位数・四分位偏差・四分位範囲・パーセント点・偏差・偏差平方和・範囲),
グラフ(ヒストグラム・箱ひげ図・散布図),2変量の関係(相関表・正の相関・負の相関・共分散・相関係数)
2012年度(平成24年度)から実施されている新高等学校学習指導要領による教育を受けた高校生は,
2015年4月以降に大学に入学します。「データの分析」が数学の科目の中で最も履修者の多い「数学
I」に置かれていることの意味は重大です。なぜなら「データの分析」の学習内容は,2014年までの
大学における入門的な統計学の授業の最初の3,4か月の学習内容と完全にかぶっているからです。
理解している学生に,同じ内容を講義したら退屈し,失望されるでしょう。でも「データの分析」 の理解度は学生によってまちまちです。だから一律に相関係数までは既知として授業を始めること もためらわれます。でも,少なくとも,これまでとまったく同じ内容の授業が許されないことだけ は確かです。
1つの提案ですが,授業の開始時期に学生にウェブでアンケートを受けてもらい,そのデータを教 材として利用し,いくぶん駆け足で具体的に講義をするのはどうでしょうか。自分達の回答で「デー タの分析」の内容を講義(高校の復習)されれば,退屈しないどころか,それらは生きた知識とし て定着します。同級生のことを知ることができる授業に興味を持たない学生はいません。このため 理解度の怪しい学生の学習意欲だって,きっと呼び起こすことができるでしょう。
インターネットはとても便利です。高機能で,しかも無料のサービスが充実しています。でも世 の中には「都合がいいだけの話」はありません。光りあるところには陰があります。インターネッ トを使って調査するときには,その陰の部分をしっかりと理解しなくてはいけません。調査を実施 する際に気を付けなければいけないことは,回答者の個人情報を保護し,プライバシーの尊重する ことです。そのための原則は,以下の2つです。
ただし好きな食べ物やタレント,休日の過ごし方,文化祭の出し物に対する希望など,比較的お おらかに質問できる調査内容もあるでしょう。この場合は無記名の原則を緩め,学生番号や出席番 号を問う質問を加えてもよいかもしれません。それに対して思想信条・資産状況・身体や精神の障 害に関する調査などは,細心の注意を払って無記名の原則を守り,匿名性を担保しなくてはなりま せん。
同一の回答者から継時的に回答してもらいたい,授業内での調査実習などで提出を確認したいな ど,回答者を特定したいときもあります。この場合は,学生番号や出席番号のような公的なIDで はなく,その調査だけに通用するIDを作り,回答者にその一時的なIDを記入してもらうとよいで しょう。
削除の原則を守るためには,手元のPCでローカルに調査データを集計しなければなりません。 ウェブ上のスプレッドシートではなく,分析ツールとして本書でRを解説した主要な理由の1つは 削除の原則を守るためです。無記名の原則と削除の原則を守ることにより,個人情報を保護し,プ ライバシーを尊重しながらインターネット調査を実施することが可能です。しかし残念ながら絶対 安全ということではありません。
編者には,あるグルメサイトを利用しているときに,システムから突然「あなたは東京都**区 **町にいますか。はい,いいえ。」という質問をされた経験があります。そのサイトに住所を知ら せていないのに,だいたい正しい居場所を指摘されたのでとても驚かされました。ウェブの閲覧は 1回1回が独立したものなのではなく,ログイン中の足跡は継続した同一人物の行動として把握さ れる可能性があります。当時,自宅の周辺のスポット天気予報を,同じIDのサイトで毎日確認し ていました。もしかしたら自宅住所をそこから類推されたのかもしれません。グルメ情報の提供シ ステムとしては,自宅近くのお店を推薦しようと,親切心で気を利かせてくれたのでしょうが,あ まり気分の良いものではありませんでした。このようにIDを対応させて,複数のデータベースの 情報を相互に関連づけることを紐付け(ひもづけ)といいます。
調査フォーム回答と,回答時にログインしているサイトでの足跡は紐付けられてしまうことが技 術的には可能です。たとえばメールサービスのサイトにログインしたままだと,サーバーにメール の平文がありますから,無記名調査でも回答時の足跡と個人情報とは紐付け可能です。したがって 無記名の原則は完全ではありません。ただしこれは飽くまでも技術的には紐付け可能であるという ことであり,このような目的外使用は違法行為です。
メールサービス・ツイッター・ライン・ブログ・その他の投稿サイトには,テキスト・画像・音 声・圧縮ファイルなど様々なコンテンツがアップされます。アップした本人は,それらが自分の所 有物であると信じ,必要なくなったら削除します。日常生活の感覚では,自分の持ち物をゴミ箱に捨てたという認識です。 しかし,削除したはずのコンテンツは,もしかしたら非表示になっている だけかもしれません。サイトから本当に削除されているか否かは,サーバーの管理者にしか分かり ません。コンテンツを本当に削除できるのはサーバーの管理者だけです。コンテンツをウェブ上に 置くということは,そういうことなのだと理解してください。したがって削除の原則を守っていて も,サーバー内で非表示になっていた調査データが,悪意のはハッカーによって違法に流出する可 能性はあります。
したがって残念ながら,無記名の原則と削除の原則を組み合わせても,犯罪的な悪意からは絶対 に安全であるとは言えません。しかし犯罪的悪意から絶対安全な状態など,なかなか望めるものではありま せん。よくよく考えてみると,メールサイトを利用すること自体,直接的な平文が有する プライバシーをサーバーの管理者に委ねているのです。これは相当に怖いことですが,私たちはそ ういう世界で既に生活しています。メールを利用することと比較すると,無記名のインターネット 調査のリスクは相当に間接的です。ネットワークには危険もあります。しかしそこから,ただ逃げ ているばかりでは,これからの世の中で生きてはいけません。ネットワーク社会における個人情報 の保護・プライバシーの尊重の教材として,インターネット調査実習を適切に活用すれば大きな教 育効果が期待できます。高校の先生,卒論指導の先生におかれては,その大きな可能性を活用して いただけたらと願うばかりです。(本書まえがきより)
目次
第1章 調査票作成を体験しよう
第2章 フォーム上級者への道
第3章 アンケート調査の企画
第4章 質問項目の作り方
第5章 アンケート結果を確認しよう-単純集計-
第6章 項目間の関連を分析しよう-相関分析・クロス表の分析-
第7章 分析上級者への道
第8章 応用的な分析へ