独立性のカイ二乗検定

こんてんつ

独立性の\chi ^ {2}検定についてやり方を紹介する。

分割表の読み方と期待度数、理論度数、\chi ^ 2統計量

f:id:norunblog:20210605191433p:plain

  • 分割表のf_{ij}は観測度数を表す。
  • f _ {i \cdot}f _ {\cdot j}は観測度数から生まれた周辺度数である。
  • p _ {i \cdot}p _ {\cdot j}は周辺度数から生まれた周辺確率分布である。

次の帰無仮説を考える。

  • 帰無仮説H_0:AとBが完全に独立。(すべてのijに対し、P(A_i \bigcap B_j) = P(A_i )P(B_j)が成立。)

ここで、相対度数(f_{ij}/n)によって推定される次の推定値をもって、


\displaystyle
\hat{p}_{i \cdot} = f_{i \cdot}/n , \qquad  \hat{p}_{\cdot j} = f_{\cdot j}/n

全てが独立という帰無仮説H_0の下で理論度数は、


\displaystyle
E_{ij} = n \hat{p}_{i \cdot}  \hat{p}_{\cdot j}

となる。これから、独立性の\chi ^ 2検定の基準


\displaystyle
\chi^2 = \sum \frac{(\mbox{観測度数 - 理論度数})^2}{\mbox{理論度数}}

を得る。理論度数が分母に来るのは、突拍子もない変な観測度数が分母に来るのを防ぐためと考えても良い。\chi ^ 2統計量は、自由度(r-1)(c-1)\chi ^ 2分布に従う。