共分散、相関係数、決定係数、変動係数の立ち位置を理解する

こんてんつ

共分散、相関係数、決定係数、変動係数やら、どれが何を意味しているのか、ごっちゃになる。それぞれの立ち位置を整理する。

一言まとめ

  • 共分散:2組のデータ(X,Y)の動きが、同じかどうかを見る指標(++、+-)。
  • 相関係数:共分散をXY標準偏差で割った無次元量。相関の程度を示す指標。
  • 決定係数:相関係数の2乗。回帰による回帰方程式の当てはまりの良さをはかる指標。
  • 変動係数:標準偏差を平均で割ったもの。平均で割ることで、異なる集団の散らばり具合を相対的に比較する指標。

詳細

共分散

2組のデータ(X,Y)の動きが、同じかどうかを見る指標である。

  • 共分散Cov(X,Y)が正に大きい⇔Xが大きい時、Yも大きい⇔正の相関がある
  • 共分散Cov(X,Y)が負に大きい⇔Xが大きい時、Yは小さい⇔負の相関がある
  • 共分散Cov(X,Y)が0に近い⇔(X,Y)に相関はない

\displaystyle
Cov(X,Y) = \frac{\sum (x_i - \overline{x})(y_i - \overline{y})}{n} \\
Cov(X,Y) = E(XY)- \{E(X)E(Y) \}

相関係数

共分散は相対的な値になるため、単位系によって大きさが異なってしまう。そこで、2つの標準偏差で割ることで、相関係数の値は単位によらず、-1から+1の間の値を取る。相関係数が0の時(共分散が0の時)二つの変数は互いに独立である。


\displaystyle
r_{xy} = \frac{\sum(x_i-\overline{x})(y_i-\overline{y})/n}{\sqrt{ \sum(x_i-\overline{x})^2}\sqrt{ \sum(y_i-\overline{y})^2}} \\
r_{xy} = \frac{Cov(x,y)}{ \sqrt{V[X]} \sqrt{V[Y]} }   = \frac{Cov(x,y)}{S_x \cdot S_y}

決定係数

相関係数の2乗。回帰による回帰方程式の当てはまりの良さをはかる指標。r_{xy}^{2}

変動係数

変動係数は、平均\overline{x}を考慮したうえで散らばり具合を相対的に比較する指標。無次元数。(東大出版 統計学入門 P.38)


C.V. = S_x/\overline{x}