본문 바로가기

김성범 교수님 유튜브 강의/파이썬 시계열 분석

시계열 분석 기초(Time Series Regression) - Part 1

728x90

 본 게시물은 김성범 교수님의 유튜브 영상 "Time Series Regression part1" 과 "Forcast : Principles and Practices"를 바탕으로 작성되었습니다. 

 영상으로 강의를 들으며 이해가 부족했던 부분은 책을 통해 채웠습니다. 중간중간 위 책의 온라인 링크를 달아놓을테니 참고하십시오.

 

1. 시계열 데이터 구성요소

1) 변동의 종류

  • 시계열자료는 시간의 경과에 따라 자료값이 변동하는데, 변동에는 불규칙변동(우연변동)과 체계적변동이 있다.
  • 불규칙변동은 어떤 규칙없이 예측불능하게 발생하는 변동.
  • 체계적변동은 어떤 규칙이나 패턴에 따라 나타나는 변동으로 추세변동(장기간에 걸쳐 서서히 자료값 자체가 변화), 순환변동(특정 주기에 따라 순환), 계절적변동(계절적 요인에 따라 1년단위로 나타나는 변동)이 있다. 
    • 계절변동은 순환변동의 일종이다.
    • 캡쳐에서 네번째 그래프는 추세+계절변동이 있는 그래프이다. 
  • additive model 은 불규칙, 추세, 순환, 계절변동의 합으로 관측값이 설명된다고 가정. 각 변동은 독립. 
  • multiplicative model 은 4가지 변동의 곱으로 관측값이 설명된다고 가정. 

 

2) 그래프 해석

  • 맨위는 관찰된 데이터. 왼쪽의 그래프를 길게 늘어뜨린 것.
  • 두번째는 추세변동을 나타냄.
  • 세번째는 계절변동
  • 네번째는 불규칙변동
  • 즉, 관찰된 데이터는 3가지 변동을 합친 것

cf) 지금까지 한 것은 시계열 예측이 아니라 그냥 관찰된 시계열 데이터를 분해한 것. 

 

" 정리하자면, 백색잡음 = 불규칙변동 이며 자기상관성이 없다. "

 

# 참고

 자기상관(autocorrelation)이 없는 시계열을 백색잡음(white noise)이라고 부릅니다. 그림 2.16은 백색잡음 시계열의 예를 보여줍니다.

Figure 2.16: 백색잡음 시계열.

 

Figure 2.17: 백색잡음 시계열에 대한 자기상관함수.

 백색잡음 시계열에 대해, 자기상관 값 각각이 거의 0일 것이라고 기대할 수 있습니다. 물론, 어떤 무작위적 변동 때문에 자기상관값이 정확하게 0은 아닐 것입니다. 백색잡음 시계열에 대해, ACF에서 뾰족한 막대의 95%가 ±2/T에 들어갈 것이라고 기대할 수 있습니다. 여기에서 T는 시계열의 길이입니다. ACF의 그래프에서 이러한 경계를 주로 그래프로 그려서 나타냅니다(위의 파란 점선 경계). 하나 이상의 커다란 뾰족한 막대가 이러한 경계를 벗어나거나 뾰족한 막대의 5% 이상이 이러한 경계를 벗어난다면, 이러한 시계열은 아마도 백색잡음이 아닐 것입니다.

 이 예제에서는 이라서 ±2/50=±0.28에 경계가 있습니다. 자기상관 계수 전부가 이러한 한도 안에 들어가는 모습이 데이터가 백색잡음이라는 사실을 말해줍니다.

 

2. 예측 오차

 

1) MAD

 

 

2) MSE

3) MAPE

 

 

질문과 비판은 언제나 환영입니다. 많이 꾸짖어주세요.

 

 

728x90