
의사결정나무 기법을 이용한 사회지표조사 자료 분석
Social Indicator Survey Data Analysis Using Decision Tree
- 한국자료분석학회
- Journal of The Korean Data Analysis Society (JKDAS)
- Vol.7 No.3
- : KCI등재
- 2005.06
- 773 - 783 (11 pages)
데이터마이닝은 방대한 양의 데이터 속에서 쉽게 드러나지 않는 유용한 정보를 찾아내는 기법으로서 각종 데이터를 기반으로 감춰진 지식, 기대하지 못했던 경향 또는 새로운 룰 등을 발견하는데 사용된다. 데이터마이닝 기법으로는 군집분석, 연결분석, 판별분석, 연관성규칙, 의사결정나무기법, 신경망모형 등의 분석 기법이 있다. 본 논문에서는 2003년 경상남도에서 조사된 사회지표 조사 자료에 대한 의사결정나무 기법의 탐색에 관하여 연구하고자 한다. 사회지표 조사 자료에서 환경관련 문항에 대하여 도민들의 의식을 심층적으로 분석하기 위하여 CART 및 C5.0 알고리즘을 적용하여 모형을 생성한다. 모형 생성 시, C5.0 알고리즘에 대하여 가지치기 강도를 다양하게 변화하여 모형을 생성한다. 생성된 모형을 비교 및 분석하고 가장 적절한 모형을 선택하여 의사결정나무 모형을 분석한다.
Data mining is the method to find useful information for large amounts of data in database. It is used to find hidden knowledge, unexpectedly pattern, and new rules by massive data. The methods of data mining are decision tree, association rules, clustering, neural network and so on. We analyze Gyeongnam social indicator survey data using decision tree techniques. We create decision tree model using CART algorithm and C5.0 algorithm so as to do expandable analysis of citizen s consciousness for environmental data in social indicator survey. When we create decision tree model, we change the pruning condition to create various models in C5.0 algorithm. And we compare the created CART model and C5.0 model to analyze the best decision tree model.
1. 서론
2. 의사결정 나무 적용
3. 의사결정나무 모형 비교
4. 분석 결과
5. 결론
참고문헌