標本調査

対象とする集団すべてを調査することを全数調査(または悉皆調査)という。これに対して集団の一部を取り出して調査するものを標本調査という。標本調査が行われる理由は次のようなものがある。

  • 調査を実施するとその対象(製品など)が破損してしまうため
  • 調査に時間がかかり、調査結果に価値がなくなるため
  • 全数調査には多額の費用がかかるため

母集団と標本

◆母集団 ・・・ 特徴や傾向を知りたいものの全体

◆標本  ・・・ 実際に調査する母集団の一部

◆標本の一部・・・標本の数(人やモノ)

◆標本の大きさ(sample size)・・・母集団から20個のデータを取り出したとすると

            「標本の大きさは20」n=20

◆標本数(number of samples)・・・同じ実験を30回繰り返し、30組のデータが得られたとすると

             「標本数は30」

 

無作為抽出法

母集団のすべての個体に通し番号を付け、その番号を確率的に抽出する。下記のような手法がある。

  • 0~99の番号が付いたくじを引く
  • 正20面体のサイコロに0~9までの数字を2個ずつ書いて抽出
  • 乱数表を用いて1つの数字を選び、そこからある方向へ順番に数字を選んでいく


自発的に回答する調査でのバイアス

自発的に回答する調査はよく行われている。例えば「レストランに置かれたお客様の声」

このような場合は、強い意見を持った人は回答するが、そうでない人や現状に満足している人はあまり回答しない。

回答は必ずしもお客様全体の声を反映しているとは限らない。

 

標準誤差

<広義>様々な推定量の精度を表す指標
<狭義>標本平均の推定精度を表す指標

 

標本から母比率pを推定する場合の標準誤差は右の式で求められる。

 

母集団が小さい場合は、「有限母集団修正項」を√の中に入れて乗じる

            (N-n)/(N-1)

 

 

必要な標本の大きさ

必要な標本サイズは右の数式で算出

 

  • Pが不明なら0.5で計算する
  • 標本誤差は信頼区間の幅
  • 信頼水準は適宜調整
    1.65(90%)、1.96(95%)、2.58(99%)

 

■似ててわかりにくい用語

非標本誤差・・・集計ミス、誤回答、恣意性介入などによる誤差
標本誤差・・・標本抽出に伴う誤差
標準誤差・・・推定量の精度を表す指標(推定量の標準偏差) σ/√n
標準偏差・・・ばらつきの大きさを表す指標