標本抽出法の違いを図と例でまとめる(多段抽出、クラスター抽出、層化抽出、系統抽出)

こんてんつ

統計検定2級でも頻出の標本抽出法について。それぞれの違いを、簡単な例と図で理解していく。

  • 図で理解
  • 定義等の確認

図で理解

  • 二段(多段)抽出法
  • クラスター(集落)抽出法
  • 層化(層別)抽出法
  • 系統抽出法

f:id:norunblog:20210123165253p:plain

f:id:norunblog:20210123165332p:plain

f:id:norunblog:20210123165507p:plain

f:id:norunblog:20210123165502p:plain

定義等の確認

二段(多段)抽出

  • 定義:一段目として何かを無作為抽出し、抽出された段の中から対象を無作為に抽出する方法。
  • メリット:全部の地域を調べられるわけではが、正真正銘ランダムに選んだ都市などで評価できる。抽出のコスト(費用)を安く抑えられる。
  • デメリット:段数を増やすほど、平均などの推定精度は低くなる。

クラスター(集落)抽出

  • 定義:母集団を網羅的に分割し小集団を構成した上で、その中から無作為に抽出されたいくつかのクラスター内の個体すべてを調査する方法。

層化(層別)抽出

  • 定義:母集団をいくつかの部分集団(層)に分割(層別)し、層ごとに無作為抽出を行う方法。
  • メリット:層内の分散を小さくすることが可能。
  • デメリット:各層の平均の推定量は大きく異なることから、得られた推定量の分散は単純無作為抽出よりも常に小さくなるとは言えない。

系統抽出

  • 定義:母集団の要素に通し番号を振り、初めの抽出単位を無作為に抽出した後は、母集団の通し番号から等間隔標本を抽出する方法。
  • デメリット:通し番号の順番に何らかの周期がある場合、標本に偏りが生じる可能性があり、こういう場合は単純無作為抽出に分が有る。