머신러닝과 통계 모형을 이용한 미술품 가격 예측
Predicting Art Price using Machine Learning and Statistical Models
- 한국자료분석학회
- Journal of The Korean Data Analysis Society (JKDAS)
- Vol.26 No.1
-
2024.02117 - 134 (18 pages)
-
DOI : 10.37727/jkdas.2024.26.1.117
- 84

미술 시장은 복합적인 문화, 경제, 사회적 특성으로 이루어져 있으며 최근 많은 관심을 받고 있다. 미술품 거래는 다양한 방식으로 이루어지며, 이중 미술품 경매는 큰 비중을 차지한다. 1920년 이후 출생한 Post-War and Contemporary Art 작가들의 경매 자료를 Artnet로부터 수집하여, 미술품 가격 예측 모형을 구현하였다. 기존 연구에서 일반적으로 사용되던 헤도닉 가격 모형 외에 회귀모형, 임의효과 모형, 정규화 모형, 트리 기반 모형, SVM 등 다양한 머신러닝 모형을 사용하여 가격 예측 성능을 비교하였다. 다양한 머신러닝 모형들을 비교하기 위해 두 가지 교차검증 방법을 사용하여 RMSE와 MAE를 비교하였다. 그 결과, 작가 정보를 활용하는 비선형 임의효과 모형이 우수한 성능을 보였다. 비선형 임의효과 모형을 사용하여 설명변수들이 가격에 미치는 영향을 분석하였다. 작가별로 시간의 흐름에 따른 다양한 패턴의 가격 곡선을 관찰할 수 있었다. 작가 정보를 활용하지 않는 머신러닝 모형 중에서는 Bagging이 가장 좋은 성능을 보였다. Bagging을 통해 변수 중요도를 구해본 결과 작품의 크기가 가격 예측에 있어 가장 영향력을 끼치는 것으로 나타났으며, 작가의 출생연도, 그림을 그린 방식, 그림을 그린 재질, 제작연도가 그 뒤를 이었다.
The art market is comprised of complex cultural, economic, and social characteristics and has recently received a lot of attention. Art transactions are carried out in a variety of ways, of which art auctions account for a large portion. We collected auction data on Post-War and Contemporary Art artists born after 1920 from Artnet and implemented an art price prediction model. In addition to the hedonic price model commonly used in existing studies, price prediction performance was compared using various machine learning models such as regression model, random effects model, regularization model, tree-based model, and SVM. To compare various machine learning models, RMSE and MAE were compared using two cross-validation methods. As a result, the nonlinear random effects model using author information showed the good performance. The impact of explanatory variables on price was analyzed using the optimal model. In addition, we were able to obtain price curves of various patterns according to the passage of time for each author. Among machine learning models that do not use author information, Bagging showed the best performance. As a result of measuring the importance of variables through Bagging, it was found that the size of the work had the most influence in predicting the price, followed by the artist's year of birth, the method of painting, the material with which the painting was painted, and the year of production.
1. 서론
2. 연구자료
3. 모형 설명
4. 연구 결과
5. 결론 및 향후 연구
References
(0)
(0)