コレログラムの見方を例題を使って理解する

こんてんつ

コレログラムを使って、データが周期性をもつかどうかを調べることができる。しかしながら、どうやってこのグラフが得られるかなどが複雑であるので、例題を使って分かりやすく解説してみる。

例題

2019年1月~2022年5月までの、電気代を例にとる。(暖房費のかかる2月ごろに大ピーク、冷房費のかかる8月ごろに小ピークがある。)

f:id:norunblog:20210718115411p:plain

これの、コレログラムは次のようになる。

f:id:norunblog:20210718125523p:plain

ラグ12、24、36で強い正の相関が認められる。また、ラグ6前後連続して負の相関が認められる。

考え方

コレログラムは、元データxと時間をずらしたデータyとの相関係数である。元データxとラグを与えたデータのyはこんな感じである。(スペースの都合上、ラグ0からラグ5までのみ載せる)

測定データ ラグ0 ラグ1 ラグ2 ラグ3 ラグ4 ラグ5
x y y y y y y y
2019年1月 12,926 12,926
2019年2月 14,333 14,333 12,926
2019年3月 13,526 13,526 14,333 12,926
2019年4月 11,720 11,720 13,526 14,333 12,926
2019年5月 11,115 11,115 11,720 13,526 14,333 12,926
2019年6月 8,824 8,824 11,115 11,720 13,526 14,333 12,926
2019年7月 8,307 8,307 8,824 11,115 11,720 13,526 14,333
2019年8月 9,636 9,636 8,307 8,824 11,115 11,720 13,526
2019年9月 10,808 10,808 9,636 8,307 8,824 11,115 11,720
2019年10月 9,890 9,890 10,808 9,636 8,307 8,824 11,115
2019年11月 9,070 9,070 9,890 10,808 9,636 8,307 8,824
2019年12月 9,750 9,750 9,070 9,890 10,808 9,636 8,307
2020年1月 12,232 12,232 9,750 9,070 9,890 10,808 9,636
2020年2月 13,201 13,201 12,232 9,750 9,070 9,890 10,808
2020年3月 13,100 13,100 13,201 12,232 9,750 9,070 9,890
2020年4月 12,117 12,117 13,100 13,201 12,232 9,750 9,070
2020年5月 10,541 10,541 12,117 13,100 13,201 12,232 9,750
2020年6月 9,153 9,153 10,541 12,117 13,100 13,201 12,232
2020年7月 8,585 8,585 9,153 10,541 12,117 13,100 13,201
2020年8月 9,661 9,661 8,585 9,153 10,541 12,117 13,100
2020年9月 11,206 11,206 9,661 8,585 9,153 10,541 12,117
2020年10月 10,152 10,152 11,206 9,661 8,585 9,153 10,541
2020年11月 8,965 8,965 10,152 11,206 9,661 8,585 9,153
2020年12月 9,137 9,137 8,965 10,152 11,206 9,661 8,585
2021年1月 11,875 11,875 9,137 8,965 10,152 11,206 9,661
2021年2月 12,854 12,854 11,875 9,137 8,965 10,152 11,206
2021年3月 13,197 13,197 12,854 11,875 9,137 8,965 10,152
2021年4月 10,696 10,696 13,197 12,854 11,875 9,137 8,965
2021年5月 9,644 9,644 10,696 13,197 12,854 11,875 9,137
2021年6月 8,169 8,169 9,644 10,696 13,197 12,854 11,875
2021年7月 8,052 8,052 8,169 9,644 10,696 13,197 12,854
2021年8月 9,403 9,403 8,052 8,169 9,644 10,696 13,197
2021年9月 10,694 10,694 9,403 8,052 8,169 9,644 10,696
2021年10月 9,600 9,600 10,694 9,403 8,052 8,169 9,644
2021年11月 8,564 8,564 9,600 10,694 9,403 8,052 8,169
2021年12月 9,435 9,435 8,564 9,600 10,694 9,403 8,052
2022年1月 12,255 12,255 9,435 8,564 9,600 10,694 9,403
2022年2月 13,035 13,035 12,255 9,435 8,564 9,600 10,694
2022年3月 13,013 13,013 13,035 12,255 9,435 8,564 9,600
2022年4月 11,191 11,191 13,013 13,035 12,255 9,435 8,564
2022年5月 9,865 9,865 11,191 13,013 13,035 12,255 9,435
9,865 11,191 13,013 13,035 12,255
9,865 11,191 13,013 13,035
9,865 11,191 13,013
9,865 11,191
9,865

それぞれの、xとyについて相関係数を取ると次のようになる。

f:id:norunblog:20210718124805p:plain

ラグ12の時の相関係数が大きいことが分かる。このように、コレログラムは元データxと時間をずらしたデータyとの相関係数をプロットしたに過ぎないのである。