딥러닝 방법론을 사용한 주가예측에 대한 탐색적 연구
An Explorative Study on the Explanatory Power of Deep Learning Model
- 한국공인회계사회
- 회계ㆍ세무와 감사 연구
- 제63권 제4호
-
2021.12195 - 223 (29 pages)
- 289
회계 변수를 이용하여 주가를 추정하는 것은 미래의 현금흐름에 대해 회계정보가 유용성을 가진다는 증거로서 학계에서 꾸준히 연구되어온 대상이다. 본 연구에서는 최근 다양한 분야에서 사용되는 딥러닝 방법론과 회귀분석 방법론을 각각 사용하여 회계 변수 및 시장 변수로 주가를 추정하는 모형의 설명력을 비교하였다. 그 결과 딥러닝 방법론이 회귀분석 방법론에 비해 평균적인 설명력이 높으나, 증가 폭은 경제적으로 유의미한 범위라고 보기 어렵다는 결과를 발견하였다. 추가적으로 딥러닝 모형의 훈련에서 사용하는 각종 매개변수 변화와 추정에 사용한 데이터의 전처리 방법의 차이 등에 따른 설명력의 차이를 비교분석 하였다. 분석 결과, 딥러닝 방법론은 매개변수나 전처리 설정에 따라서 회귀분석보다 효율적이지 못한 결과를 가져올 수도 있다는 점을 발견하였다. 그리고 연구자의 도메인 지식을 사용하는 것이 머신러닝에만 기계적으로 의존하는 것보다 나을 수 있다는 점 역시 발견하였다. 예를 들어 전통적인 연구에서 회계변수를 총자산 등으로 나누어 주는데, 이러한 방식은 딥러닝에서도 모형의 설명력을 증가시키는 것으로 나타났다. 또한 딥러닝 모형은 극단치를 제거하지 않는 경우에 설명력이 더 높은 것으로 나타났다. 이는 전통적인 선형성 가정이 극단적인 상황에서 맞지 않으나, 극단치를 기계적으로 제거하는 것이 데이터의 중요한 정보를 제외하는 결과를 가져올 수 있다는 함의를 제공한다. 이 논문의 결과는 추후 연구에서 딥러닝 방법론과 회귀분석 사이의 선택에 참고가 될 것으로 기대한다.
In this research, we compare the explanatory power between linear regression model and deep-learning model when estimating stock returns. As predicted, the deep-learning model shows statistically significant improvement over linear regression model, although the improvement is not economically meaningful. We further investigate the effects of deep-learning model using different parameters and pre-processing. The results show that the predictive power of deep-learning model can be worse-off than that of linear model if it fails to select optimal parameters. Especially, it is important to choose adequate deep-learning parameters not to overfit the data, because the accounting data (which is at most quarterly) may not be sufficient enough for the deep model structure. Further, we show that the predictive power using researchers’ domain knowledge is sometimes better off than that relying simply on the deep-learning model. For instance, denomination with total assets brings better results than non-denomination. Another interesting finding is that winsorizing extreme values brings lower explanatory power when we use the deep-learning model. Such finding implies that, by removing extreme values, we may lose useful information in the parameter estimation. The results of this paper will help future research decide whether to utilize deep learning model or linear regression model.
Ⅰ. 서 론
Ⅱ. 선행연구
Ⅲ. 연구방법론
Ⅳ. 분석 결과
Ⅴ. 결 론
(0)
(0)