母平均の差の検定

こんてんつ

二つの正規母集団の母平均の差の検定について述べる。

母分散\sigma _ 1 ^ 2\sigma _ 2 ^ 2が既知か?等しいか?否か?

母平均の差の検定は、検定する二つの母分散\sigma _ 1 ^ 2\sigma _ 2 ^ 2の情報によってやり方が異なる。

  • 二つの母分散\sigma _ 1 ^ 2\sigma _ 2 ^ 2が既知の時。
  • 二つの母分散\sigma _ 1 ^ 2\sigma _ 2 ^ 2は未知であるが、等しい時(\sigma _ 1 ^ 2 = \sigma _ 2 ^ 2 = \sigma ^ 2)。
  • 二つの母分散\sigma _ 1 ^ 2\sigma _ 2 ^ 2は未知であり、等しいとは限らない時(\sigma _ 1 ^ 2 \neq \sigma _ 2 ^ 2)。

母分散\sigma _ 1 ^ 2\sigma _ 2 ^ 2が既知の時

二つの母分散\sigma _ 1 ^ 2\sigma _ 2 ^ 2が既知の時は、

  • 標本平均\overline{X}の分布はN(\mu _ 1, \sigma _ 1 ^ 2 / m)に従う。
  • 標本平均\overline{Y}の分布はN(\mu _ 2, \sigma _ 2 ^ 2 / n)に従う。

よって、

  • \overline{X}-\overline{Y}の分布はN(\mu _ 1 - \mu _ 2, (\sigma _ 1 ^ 2 / m) + (\sigma _ 2 ^ 2 / n))に従う。

よって、これを標準化した


\displaystyle
Z = \frac{(\overline{X}-\overline{Y})-(\mu _ 1 - \mu _ 2)} {\sqrt{ (\sigma _ 1 ^ 2 / m) + (\sigma _ 2 ^ 2 / n) }}

は、標準正規分布N(0,1)に従うので、これを用いて推定や検定を行う。

母分散\sigma _ 1 ^ 2\sigma _ 2 ^ 2は未知であるが、等しい時

母分散\sigma _ 1 ^ 2\sigma _ 2 ^ 2が未知であるが、等しいと分かっている時は、

  • \overline{X}-\overline{Y}の分布はN(\mu _ 1 - \mu _ 2, (1/m + 1/n) \sigma ^ 2 )に従う。

が、しかし、\sigma ^ 2が未知であるから、代わりに合併した標本分散s ^ 2で推定する。これは、


\displaystyle
s^2 = \frac{\sum (X_i - \overline{X})^2 + \sum (Y_i - \overline{Y})^2 }{m+n-2} = \frac{(m-1)s_1^2 +(n-1)s_2^2}{m+n-2}

である。ここで、標準化した、


\displaystyle
Z = \frac{(\overline{X}-\overline{Y}) - (\mu _ 1 - \mu _ 2)}
{\sqrt{ (\frac{1}{m} + \frac{1}{n}) \sigma^2 }}

は標準正規分布N(0,1 ^ 2)に従う。これに対して、標本分散s ^ 2で代用した2標本t統計量、


\displaystyle
t = \frac{(\overline{X}-\overline{Y}) - (\mu _ 1 - \mu _ 2)}
{ s \sqrt{ \frac{1}{m} + \frac{1}{n} }}

は、自由度(m+n-2)のt分布t(m+n-2)に従い、これを推定や検定に用いる。

母分散\sigma _ 1 ^ 2\sigma _ 2 ^ 2は未知であり、等しいとは限らない時

  • 標本平均\overline{X}の分布はN(\mu _ 1, \sigma _ 1 ^ 2 / m)に従う。
  • 標本平均\overline{Y}の分布はN(\mu _ 2, \sigma _ 2 ^ 2 / n)に従う。

よって、

  • \overline{X}-\overline{Y}の分布はN(\mu _ 1 - \mu _ 2, (\sigma _ 1 ^ 2 / m) + (\sigma _ 2 ^ 2 / n))に従う。

よって、これを標準化した


\displaystyle
Z = \frac{(\overline{X}-\overline{Y})-(\mu _ 1 - \mu _ 2)} {\sqrt{ (\sigma _ 1 ^ 2 / m) + (\sigma _ 2 ^ 2 / n) }}

は、標準正規分布N(0,1 ^ 2)に従う。が、しかし、\sigma _ 1 ^ 2\sigma _ 2 ^ 2が未知であるから、代わりに標本分散 s _ 1 ^ 2  s _ 2 ^ 2で推定する。これは、


\displaystyle
t = \frac{(\overline{X}-\overline{Y})-(\mu _ 1 - \mu _ 2)} {\sqrt{ (s _ 1 ^ 2 / m) + (s _ 2 ^ 2 / n) }} \\
s _ 1 ^ 2 = \sum (X_i - \overline{X})^2 / (m-1) \\
s _ 2 ^ 2 = \sum (Y_i - \overline{Y})^2 / (n-1)

であるが、この場合の検定統計量tは、ウェルチの近似法より、自由度が


\displaystyle
\nu = \frac{( \frac{s_1^2}{m} + \frac{s_2^2}{n})^2}
{ \frac{(s_1^2/m)^2}{m-1} + \frac{(s_2^2/n)^2}{n-1} }

に最も近い整数 \nu ^ { * } のt分布 t ( \nu ^ { * } )に従い、これを推定や検定に用いる。