自由度調整済み決定係数の定義と意味を理解

☆こんてんつ

自由度調整済み決定係数の定義と意味を確認する。ノーマルな決定係数の詳細については、下記の記事を参考。

contents-open.hatenablog.com

★概要

ノーマルな決定係数は説明変数の数を増やせば増やすほど1に近づいてしまう。そこで、説明変数の数が多い場合、この問題を補正した「自由度調整済み決定係数」(自由度修正済み決定係数)を使う。

★ノーマルな決定係数R^{2}の定義


\begin{eqnarray}
R^2&=& 1-\frac{RSS}{TSS} = \frac{ESS}{TSS} \\
&=& 1-\frac{\sum ({\hat{Y}_i}-\overline{Y})^{2}}{\sum (Y_i-\overline{Y})^{2}} = \frac{\sum (Y_i-{\hat{Y}_i})^{2}}{\sum (Y_i-\overline{Y})^{2}} 
\end{eqnarray}

この式が意味するところは、「X_iY_iを完全に説明している時、すべてのiRSS=0, ESS=1でありR^{2}=1となる。逆に、X_iY_iを全く説明できない時、すべてのiRSS=1, ESS=0でありR^{2}=0となる。

★自由度調整済み決定係数R_{f}^{2}の定義


\begin{eqnarray}
R^2 
= 1-\frac   {  \frac{\sum ({\hat{Y}_i}-\overline{Y})^{2}}{n-k}}    {\frac{\sum (Y_i-\overline{Y})^{2}}{n-1}}
= \frac    {\frac{\sum (Y_i-{\hat{Y}_i})^{2}}{n-k}}     {\frac{\sum (Y_i-\overline{Y})^{2}}{n-1}}
\end{eqnarray}

kは説明変数の数である。説明変数の数だけ、分子の自由度を減らしてあげていると考えればよい。単回帰分析においてはk=1である。

また、R^{2}R_{f}^{2}の間には、


\begin{eqnarray}
R_{f}^{2} = 1-(1-R^2) \frac{n-1}{n-k}
\end{eqnarray}

の関係がある。