전체 글 (61) 썸네일형 리스트형 ARIMA 모델 개요 - Part 2 1. ARIMA model Procedure 1. 먼저 전처리를 한다(로그변환, 차분 등) 2. test용 모델을 만들어본다. 3. 파라미터를 예측한다. 4. check 5. 사용 뒤에 예시에서 이런 순서를 통해 모델을 구축하고 예측해보겠다. 2. 예시 1) Preprocessing(차분) (1) 원본 데이터 (2) ACF(for checking stationary) ACF 를 확인할 때, lag가 0이면 자기 자신과의 correlation 이므로 당연히 1. 따라서 lag가 1일 때부터 보면 된다. ACF 그래프가 서서히 작아진다면 이는 non-stationary 일 가능성이 높고, 급격히 작아지거나 일정한 패턴이 없는 경우는 stationary 일 가능성이 높다. 예시의 경우 비정상성이라고 판단할 수.. ARIMA 모델 개요 - Part 1 1. 정상 프로세스(Stationay Process) 1) 정의 # 참고 먼저 정상성이라는 조건이 필요한 이유에 대해 한번 생각해보자. 이 생각이 정답이라는 것은 아니다. 우리는 시간의 순서에 따라 기록되지 않은 일반적인 자료들을 분석할 때, 확률표본(Random samples)들에 i.i.d(All samples are independent and identically distributed) 가정을 한다. 시간에 종속되어있는 시계열은 상식적으로 i.i.d 가정을 할 수 없다. 그래서 이러한 시계열 자료에 대해 예측 모형을 적합하고 통계적 검정을 하기 위해서는 분석을 단순화 시킬 수 있는 새로운 가정이 필요하다. 이중 가장 중요한 것이 시계열 모형의 확률적 성질이 시간에 따라 변하지 않는다고 가정하는 정.. 시계열 분석 기초(Time Series Regression) - Part 3 Topic : 계절적 변동을 어떻게 모델에 포함시킬까? 1. Modeling Seasonal Variations Trend와 Seasonal 변동이 있을 때 yt 는 위와 같이 나타낼 수 있다. 2. Binary 방식을 통한 모델링 원핫인코딩 벡터처럼 binary 방식으로 해당하는 season의 값만 가진다. t 시점이 1월이면 M1 = 1이고 나머지 M = 0. 12월이면 그냥 다 0. M1~11 만으로 12월을 표현할 수 있음. Trend 는 Linear Trend를 가정. 참고로 Increasing seasonal variation이 관찰되어 yt*은 yt 를 자연로그변환한 것. 모든 M=0 일 때 12월을 나타내므로, 12월이 기준이다. 따라서 beta2 는 12월과 1월에서의 y 값이 얼마나 차.. 이전 1 ··· 3 4 5 6 7 8 9 ··· 21 다음