본문 바로가기

김성범 교수님 유튜브 강의/파이썬 시계열 분석

ARIMA 모델 Python 실습

728x90

# 캐글 노트북

캐글 노트북으로 작성했으니 전체 코드 및 설명은 아래 링크를 참조바람.

 

https://www.kaggle.com/shutupandsquat/air-passengers-prediction-korean

 

Air-passengers prediction(한국어, korean)

Explore and run machine learning code with Kaggle Notebooks | Using data from Air Passengers

www.kaggle.com

 

1. 분석 주제

 

  • 월별 air passengers 데이터를 가지고 시계열 모델을 만들어 볼 것이다.
  • 캐글 노트북을 통해 작성하였으며 아래의 링크로 들어가면 된다.

2. 시계열 분해

 

otexts.com/fppkr/components.html

 

Forecasting: Principles and Practice

2nd edition

Otexts.com

  • 시계열 분해는 시계열 데이터를 몇가지 시계열 성분(추세, 주기, 계절성, Residual)으로 이루어졌다고 가정하고 그 성분들로 분해하는 것이다.
  • 이 때 시계열 성분의 결합 방식은 'additive' 와 'multiplicative' 로 나뉜다.
  • 그래서 어떻게 분해를 하느냐~
    • 여러가지 기법이 존재하는데, 우선 고전적인 방법을 소개하겠다. 다른 기법들은 세부적으로 시계열 성분을 계산하는 알고리즘이 다르며 전반적인 흐름은 같다.
덧셈 분해(곱셈분해는 그에 맞게 나눠주거나 곱해주면 됨)

1 단계) m이 짝수이면, 2×m-MA를 사용하여 추세-주기 성분 T^t을 계산합니다. m이 홀수이면, m-MA를 사용하여 추세-주기 성분 ^Tt을 계산합니다.

2 단계) 다음과 같이 추세를 제거한 시계열을 계산합니다: yt−T^t.

3 단계) 각 계절마다 계절성분을 측정하기 위해, 해당 계절에 대해 추세를 제거한 값의 평균을 구합시다.
예를 들면, 월별 데이터에서 3월의 계절성분은 데이터에서 추세를 제거한 모든 3월 값의 평균입니다. 그러면 이러한 계절성분 값이 0 근처의 값이 되도록 조정됩니다. 이러한 월별 값을 순서대로 모으고 각 연도의 데이터에 대한 수열을 복제하여 계절성분을 구합니다. 이렇게 S^t을 얻습니다.

cf) 그니까 각 월에서 추세성을 제거하고 그 추세성이 제거된 값을 평균하여 해당 월의 계절성을 구하는 것.

4 단계)다음과 같이 측정한 계절성과 추세-주기 성분을 빼서 나머지 성분을 계산합니다:
R^t= yt − T^t − S^t

 

 

 

728x90

'김성범 교수님 유튜브 강의 > 파이썬 시계열 분석' 카테고리의 다른 글

ARIMA 모델 - Part 6  (0) 2021.01.14
ARIMA 모델 - Part 5  (0) 2021.01.13
ARIMA 모델 - Part 4  (0) 2021.01.13
ARIMA 모델 개요 - Part 3  (0) 2021.01.12
ARIMA 모델 개요 - Part 2  (0) 2021.01.10