상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
153766.jpg
KCI등재 학술저널

머신러닝을 활용한 계절 시계열 예측

Seasonal Time Series Forecasting using Machine Learning

DOI : 10.37727/jkdas.2020.22.5.1779
  • 387

시계열 자료로부터 예측을 수행하기 위해 널리 사용되는 통계적 방법으로 ARIMA모형이 있다. 그러나 ARIMA 모형은 현대에 와서 크고 다양한 형태를 가지는 시계열 자료에서 좋은 예측성능을 발휘하지 못한다는 단점을 가지고 있다. 본 논문에서는 주기의 특성을 반영하여 ARIMA 모형보다 성능이 좋은 머신러닝 기법을 제안한다. 이에 대한 방법론으로 STL 분해와 Fourier 변수를 사용한다. STL 분해는 데이터를 추세, 계절, 나머지 변수로 나누기 때문에 좀 더 주기의 특성을 반영할 수 있다. 또한, Fourier 변수는 시점에 따라 사인/코사인 형태의 값을 부여하여 서로 비슷한 시점끼리의 자료를 모형에 잘 반영할 수 있다는 장점이 있다. 이처럼 생성된 데이터 중추세 변수는 ARIMA 모형에 적합하고 나머지 변수들을 선형 회귀모형, 서포트 벡터 회귀, 의사결정 나무 모형 등 7개의 알려진 머신러닝 모형에 적합하여 모의실험과 한국전력 데이터를 사용하여 머신러닝 모형끼리 비교하여 가장 예측 성능이 뛰어난 모형을 제시하였다. 또한 적절한 주기의 개수를 지정하여 예측 성능에 뛰어난 주기의 개수를 제시한다. 위의 방법을 검증하기 위해 모형을 가정하여 생성된 데이터와 실제 데이터를 이용하여 모의실험을 진행하였다.

ARIMA is a widely used statistical method for making predictions from time series data. However, ARIMA has a drawback that it does not exhibit good prediction performance in large and diverse time series data in modern times. In this paper, we propose a machine learning technique that reflects the characteristics of the period and has better performance than the ARIMA model. As a methodology for this, STL decomposition and Fourier terms are used. STL decomposition divides the data into trend, season, and remaining variables, so it can reflect the characteristics of the period more. In addition, the Fourier term has the advantage of being able to reflect data between similar viewpoints well in the model by assigning sine/cosine values according to viewpoints. Among the generated data, the trend variable fits the ARIMA model, and the remaining variables are fitted to 7 known machine learning models, including linear regression, support vector regression, and decision tree.

1. 서론

2. 연구배경

3. 연구방법

4. 모의실험

5. 사례 연구

6. 결론

References

로딩중