こんてんつ
最小二乗法や回帰分析に関わる表現を、行列によって理解したいと思った。自分用のメモである。
線形モデルの行列による表現
一元配置モデルでも良いのだが、簡単のため次の多項式モデルを考える。
上のようなモデルは、
観測値のベクトル
計画行列
未知母数
誤差ベクトル
によって、次のように書ける。
最小二乗法の原理
データとその期待値の偏差二乗和を最小にするを求めることが最小二乗法の原理である。
と表され、上記を最小にする。
誤差分散の推定
最小二乗法により線形モデルを当てはめた後の残差の二乗和は、線形モデルの誤差分散に関する情報を担っている。
残差平方和の期待値は、
- 誤差分散
- のランク
を用いて、
と書ける。(証明は東大出版「自然科学の統計学P.52」などにある。やや長文なので結果のみの記載とします。)
これらから、とし、
と置くと、これが誤差分散の不偏推定量を与える。ここで、は自由度と呼ばれる。
ここで、この推定量の平方根を取ったのことを推定値の標準誤差(s.e. : standard error of estimates)と呼ぶ。これは、回帰方程式の当てはまりを表す表現であり、を回帰残差を用いて、
と書く場合が多い。
自由度
自由度はで与えられる。例えば、
のランクは、3である。こんな感じで応用すればよい。
t検定
について、以下を考える。
の様に表現されている場合を考える。この場合の最小二乗推定量の期待値は、
分散は、
に従う。
t検定は、ある指定可能関数に関する帰無仮説の検定に他ならない。の仮定の下で、検定に用いるt統計量は
となる。ここで、は誤差分散の不偏推定量(不偏分散)。は自由度のt分布に従う。しばしばこのt統計量は、偏回帰係数の推定値と推定値の標準誤差 を用いて、
と書く場合が多い。