アンケートのサンプル数 - 趣味とかの活動

皆さんはこういった文章を見たことはないですか？

「日本国民約1億人を調査するには1000人程度で十分」

これ，分からない人にとっては「何を言ってるんだ？少なくとも100万人くらいいないとダメじゃね？」ってなると思います．

しかしこれは統計的には正しいものです．

f:id:coast_Gjirea:20190729233922j:plain — アンケートに必要な標本数 (出典：総務省)

標本数とは，サンプルの数です．1500人からアンケートを取った場合は1500を代入します．(とはいってもこっちが欲しい数なので代入することはないですが．)

回答比率とは，母比率(全体の比率)とも言い，事前に得られている回答結果などを利用するらしいですが，それが得られていない場合はnが最大となるように0.5を代入します．(これによって，分からない場合でも必要な値より小さくなることがありません．)

標本誤差は，何%までの誤差を許容するかというものです．50%という結果が得られたものに対して，3％の誤差を許容していれば，48.5~51.5%の間に結果があることは保証できるというものです．小さければ小さいほどもちろんいい調査になります．

信頼水準とは，その誤差区間に収まっている確率です．95％の確率で，誤差は3%の比率内に収まっている．といった感じです．λには95％なら1.96，99%なら2.57という風に少々特殊な数字を入れます．気になる人は正規分布表を眺めたら原理がわかるかもしれません．これは，大きければ大きいほどいい調査と言えるでしょう．

適当にp=0.5，d=3%，λ=1.96を入れると1067.1となり，1068サンプルあれば，95%の確率で誤差3%以内の正しいアンケートだという風に言えます．

気が付いた人もいるかと思いますが，これには元々何人いるのかということは関係ありません．たとえ全小学一年生の調査をしたくても，全高校生の調査をしたくても，全主婦のアンケートをしたくても，はたまた全国民，全世界の人々のアンケートをしたくてもこの数は揺るがないのです．(ちょっと語弊がありますが)

つまり，統計的には本当に1000人程度のアンケートで割と正しそうな全国民の意見を反映できるということです．統計学ってすごい！！！

しかし，そんなうまくいかないのが世の常です．世の中は残酷です．

例えば，以下のようなアンケートとその結果があったとします．(ここから述べられているアンケートなどはすべて仮想のものです．)

5歳以上の全国民1000人に聞きました！あなたは高齢者の免許返納に賛成ですか？

賛成：35％

この結果を見せられたら，んー・・・まあそうか・・・まだまだ老人が住みやすい世界にはなってないんだなぁ・・・となると思います．高齢者が車を運転しなくてもいい世界を作るのは我々交通の研究に携わっている人間の使命だと思います．

これは先ほどまで述べたような統計的な観点から見ても正しい意見ですね．

じゃあ次，

65歳以上の全国民1000人に聞きました！あなたは高齢者の免許返納に賛成ですか？

賛成：35％

は？待て待て，そのアンケートおかしいでしょ．そんなの老人から見たら返納したくない人多くなるにきまってるじゃん．

そう思うでしょう．至極まっとうな意見です．年齢によって結果が変わりそうなアンケートを限定した年齢層相手に聞いても国民の総意とは言えません．

また次，

秋田県に住む1000人に聞きました！あなたは高齢者の免許返納に賛成ですか？

賛成：35%

これもおかしいと感じるでしょう．秋田県に関係ある人には申し訳ありませんが，秋田県は日本でもかなり田舎に部類されるであろう都道府県で，高齢者の割合が日本の都道府県の中で一位です．その秋田県で仮にランダムに1000人にアンケートを取ったとしても高齢者が多くなり，さらには電車やバスの便も悪いため免許を返したくない，返したらかわいそうという意見が多くなるはずです．

このように，アンケートの結果は受ける人の年齢や境遇によって容易に変わります．このような事態を避けるために，上記の標本数の議論における全標本は無作為に抽出したものである必要があります．

この無作為に抽出がなかなかに曲者です．こんなアンケートはどうでしょうか．

iPhone XSを持っている1000人に聞きました！あなたは自動運転技術の参入について賛成ですか？

賛成：70%

iPhone XSなんて持っている人にはいろんな人がいるし大丈夫じゃない？と思う人もいるかと思いますが，実はこれも怪しいのです．

iPhone XSという最新のシリーズを持っている人は新しい技術に興味がある人間である傾向にあるため，同じく新しい技術である自動運転技術の参入に賛成する可能性が高いという事態が起こりえます．

事実，このようなことを言われることは多々あり，アンケート調査などを頻繁に行う弊分野ではかなり気にしなければならないことです．

最後のアンケート，

サイトに登録している1000人にアンケート！あなたは普段コンビニのお弁当を食べますか？

はい：60％

これも気を付けなければいけません．サイトの性質によって変わってきます．

もしこのサイトが20代の若者を対象にしているようなサイトであったら，全体の確率よりも高い結果になる可能性があります．

このサイトには様々な健康コラムなどが載っていると低い結果になる可能性があります．

また，このアンケートを答えることによって得られるポイントなどが，コンビニで用いることが出来るものだと，コンビニを頻繁に利用するような人がアンケートに多く答えているかもしれません．それでは，本来よりも高い結果になるかもしれません．

そもそもこういったサイトに訪れるような人は国民全員の中から無作為に抽出したと言えるのか？

このように，風が吹けば桶屋が儲かるようにいろいろなこじつけが可能です．そしてそのアンケートのうわべの結果だけではそれらを否定する手段はありません．

マイナンバーの下一桁や，国民全員に番号を振ってその中からランダムに選び，アンケート用紙を送って結果を返してもらう，というようなことをしても，アンケートを答えてくれる人はそもそもそういったことに関心がある．

答えなければ罰金を科すといっても年収が違うため罰金のきつさが違う．

懲役5年といっても，もしかしたら刑務所の方がいい生活だからと答えないかもしれないという風に，完全な無作為抽出はほぼ不可能です．

結果とそういった性質に関係がないかはまた別の調査，処理をする必要がありますし，いちいちやっていてもキリがありません．

長々と何を言いたかったかと言いますと，統計的に正しいのは統計的に正しいだけで，完全に正しいとは限らないということです．

よくTwitterなどで，アンケート調査における調査数の少なさに物申している人に対して，これは統計的に正しいと言っている人を見ますが，僕個人の意見としてはそのアンケートへの批判の大半はおおむね正しいと思います．

実際にこういったことをわかったうえでアンケートを批判している人は少ないのかもしれませんが，統計的に有意というのは，無作為に抽出したという条件の下で成り立つものであり，無作為抽出がほぼ不可能なため実際には机上の空論にしか過ぎないことが多いです．

しかし，実際に全数調査をすることは限りなく不可能に近いので，ある程度はアンケートの結果から全体の意見を参考にする必要があるのも事実です．

僕個人としては，一見正しそうに見えるアンケート調査も，正しくなさそうに見えるアンケート調査も，"あくまでそういう結果もあるよね"程度に見るのがいいのかなと思います．

長文失礼しました．何か質問や間違っていることがあったら是非コメントで．

お疲れ様です．

参考文献

総務省：調査に必要な対象者数

https://www.stat.go.jp/koukou/trivia/careers/career8.html