
함수자료대응분석의 정형화 시도
An Attempt to Standardize Functional Data Correspondence Analysis
- 한국자료분석학회
- Journal of The Korean Data Analysis Society (JKDAS)
- Vol.10 No.1
- : KCI등재
- 2008.02
- 197 - 210 (14 pages)
비교적 최근에 개발된 자료분석기법인 함수자료분석(functional data analysis)의 방법론과 전통적인 자료분석기법인 대응분석(correspondence analysis)의 기본개념이 결합된 소위 함수자료대응분석(functional data correspondence analysis) 이란 기법은 아직까지 소개되거나 언급조차 된 적이 없다. 이에 본 연구에서는 가상의 한 자료분석 문제를 제기하고 이를 통해 함수자료대응분석 이란 이름의 자료분석기법에 대해 그의 정형화를 시도한다. 기본 흐름은 다음과 같다. ①집단별 자료로부터 각 집단의 확률밀도함수를 추정하고, ②집단을 행, 부분구간을 열, 추정된 확률밀도함수에 근거하여 계산된 추정 자료수를 셀의 값으로 갖는 이원분할표들 중 카이제곱 통계량 값을 최대로 하는 이원분할표를 얻고, ③이에 대해 단순대응분석을 실시하여 행범주 및 열범주 좌표점들을 구한다. ④마지막으로 열범주 좌표점들에 대한 평활화를 통해 대응함수곡선 을 구한다. 물론 부분구간의 적절한 개수 결정은 카이제곱통계량 값들이 변화하는 패턴을 참조하여 이루어진다.
A so-called functional data correspondence analysis is not yet introduced in and is not yet commented about, which is combined with methodologies of recently-developed functional data analysis and a fundamental concept of classical correspondence analysis. So this paper makes an attempt to standardize it with an artificial problem of data analysis. Its main steps are followings: ①to estimate probability density functions by group, ②to make an optimal contingency table of which each row represents a group, each column a sub-interval, each cell-value an estimated frequency from the estimated pdf, ③to get row coordinates and column coordinates from a simple correspondence analysis of the last optimal contingency table, and finally ④to get a curve of correspondence function by smoothing the column coordinates. The decision on the proper number of sub-intervals depends maybe on the pattern of the values of chi-square statistic.
1. 문제제기
2. 함수자료분석과 대응분석
3. 단순대응분석의 설명과 여러 가지 표현
4. 함수자료대응분석의 정의 및 분석절차
5. 가상자료에 대한 함수자료대응분석의 실시
6. 논의 및 결론
참고문헌