사용자 성향 그룹 분류를 위한 머신러닝 모델 비교
Comparison of Machine Learning Models for Classification into User-oriented Groups
- 한국자료분석학회
- Journal of The Korean Data Analysis Society (JKDAS)
- Vol.19 No.5
- : KCI등재
- 2017.10
- 2501 - 2507 (7 pages)
작년 알파고를 통해 머신러닝에 대한 관심도가 많이 증가하였다. 머신러닝은 어떤 작업의 패턴, 이상 감지, 예측 등을 할 수 있으며 그것을 통해 앞으로의 일에 대해 미리 대처하고 사고를 줄일 수 있다. 하지만 머신러닝을 통해 성공적인 분석을 위한 핵심적인 요소가 있으며, 그 요소 중 데이터의 양이 많으면 많을수록 더욱 정확한 분석이 가능하고 그것에 맞는 학습법을 선택해야 하는 부분이 있다. 본 연구에서는 데이터가 중첩되어 쌓이는 상황에서 정확한 분석을 할 수 있는 모델을 찾기 위해 가장 많이 사용되고 있는 딥러닝 모델과 랜덤 포레스트 모델을 이용하여 개월 별로 쌓여가는 데이터에 대해서 어떤 모델의 정분류율이 더 잘나오며, 많은 데이터에 대한 적합한 모델이 어떤 것인지에 대해 살펴보았다. 분석결과 딥러닝을 적용한 결과가 데이터가 많아질수록 정분류율이 높아짐을 볼 수 있었다.
Interest in machine learning increased many times through selecting Alphago last year. Machine learning enables you to perform patterns of operations, abnormality detection, prediction, etc., so that it is possible to deal with future work in advance and reduce accidents. However, there is an important element for success analysis through machine learning, the more the amount of data of the element, the more accurate analysis is possible, there is a need to select a learning method suitable for it. In this research, using deep learning models and random forest models, which are most frequently used to find a model that can perform accurate analysis in situations where data is superimposed, data accumulated monthly We investigated what kind of improving correct rate of the model well got out and what kind of appropriate model of many data is for the data. As a result, we found that deep learning model was more accurate than random forest model.
1. 서론
2. 랜덤 포레스트(random forest)와 딥러닝(deep learning)
3. 데이터 분석
4. 결론