주기도의 상관성을 이용한 시계열자료의 군집분석
Time-series Data Clustering Based on the Correlation of Periodogram
- 한국자료분석학회
- Journal of The Korean Data Analysis Society (JKDAS)
- Vol.22 No.5
-
2020.101751 - 1766 (16 pages)
-
DOI : 10.37727/jkdas.2020.22.5.1751
- 이용수 78

초록
시계열 자료를 군집화할 때, 시계열의 계열수가 많은 경우에는 자료의 특성이 유사한 시계열들을 군집화한 후 이를 사전정보로 활용하여 모형설정 및 예측을 수행한다면 훨씬 효율적일 것이다. 시계열 자료의 군집분석 방법에는 다양한 거리가 정의될 수 있으며, 크게 두 가지로 구분한다. 첫째는 시간영역(time domain)에서의 분석으로, 시계열 자료의 특성인 자기상관함수(auto-correlation function), 부분(partial)자기상관함수로부터 거리(distance)를 정의하는 방법이다. 둘째는 주파수영역(frequency domain)에서의 분석으로, 표본 자기공분산함수(sample auto-covariance function)를 통해 얻어지는 주기도(periodogram)를 이용하여 거리를 정의하는 방법이다. 본 연구에서는 스펙트럼 밀도함수(spectral density function)의 추정량인 주기도 간의 상관성(association)에 근거한 거리를 제안하였다. 먼저 기존에 시계열 자료를 그룹화하는 데 사용된 거리들을 간략히 소개하고, 주기도 간의 상관관계로부터 거리를 제안하여 모의실험을 통해 성능을 비교하였다. 또한, 1990년 1월부터 2015년 4월까지 전국 월별 제조업생산지수 자료를 대상으로 기존의 거리와 본 연구에서 제안한 거리를 이용하여 산업 간의 군집화를 시도하였다.
The main goal of clustering time-series data is to clarify how similarity between time-series can be measured. There are two different approaches for identifying the similarity. The first approach focuses on the distances based on autocorrelation function and partial autocorrelation function inherent in given time-series measurements. The distances between estimated parameters under ARIMA model are also proposed. The second approach considers the time series clustering based on the estimator of spectral densisty function named periodogram and its transformations realized in the frequency domain. In this papar, we propose the metrics based on relationships between (smoothed) periodograms for the time-series data classification. The proposal is based on Pearson’s correlation and intra-class correlation. We evaluated the similarity metrics of our interest via three different simulation scenarios. A real-data analysis with 24 Korea manufacturing production indices data is also presented.
목차
1. 서론
2. 유사성 거리 척도
3. 모의실험
4. 실증연구
5. 결론
References
참고문헌 (0)
등록된 참고문헌 정보가 없습니다.
해당 권호 수록 논문 (36)
- SAMC 알고리즘을 이용한 미디어 패널 개인화 추천 알고리즘
- 대학 인재상을 반영한 대학생 인성역량 평가지표 개발
- 2020년 국회의원 선거 기간의 유튜브 빅데이터 분석
- 상사의 비인격적 감독과 고객의 불량 행동이 카지노 종사원들의 감정노동을 매개로 직무소진에 미치는 영향
- 동료 튜터링을 통한 사회정서역량 및 대학생 핵심역량 향상도 분석
- 주기도의 상관성을 이용한 시계열자료의 군집분석
- 소매업체의 옴니채널 서비스가 고객경험 및 고객충성도에 미치는 영향
- 오픈 데이터와 격자 시스템을 이용한 세종시 실제 인구 추정
- 코로나 19 전·후의 대학생 체육활동이 역량변화에 관한 연구
- 중학교 국어교과서에 제시된 글의 장르 특성 비교 분석
- 가우시안 반응 모형을 활용한 정준대응분석 고찰
- 치매 발병 여부 예측을 위한 통계적 모형 및 기계학습 기반 기법 적용에 관한 연구
- 제주지역 정보화마을 자립 및 활성화 요인 분석
- 간호대학생의 문화적 역량과 윤리적 민감성이 간호전문직관에 미치는 영향
- LSTM 기반 모형의 주식시장 예측성 분석
- 머신러닝을 활용한 계절 시계열 예측
- OECD 자료를 활용한 상속세가 민간투자와 경제성장률에 미치는 영향 분석
- 범죄자 프로파일링을 위한 존속 살인 연구
- 우리나라 4대 도시의 인구이동과 수렴속도의 관계에 대한 실증분석
- 아마추어 골퍼의 라이 변화가 샷에 미치는 영향
- 사회적기업 직원들의 개인-조직 그리고 개인-직무 적합성 인식이 직무태도에 미치는 영향
- 인라인 스케이트 클럽의 서비스스케이프가 서비스 만족과 재구매의도에 미치는 영향
- 지지면과 욕창 단계에 따른 경계압력 차이
- 국내 이직 관련 질적 연구 및 빅데이터 연구에서 나타난 이직 선행요인에 대한 종합적 검증
- 자본 및 유동성 위험수준이 은행의 위험감수행위에 미치는 영향에 관한 연구
- 버퍼거리에 따른 공간 랜덤포레스트를 이용한 월 평균기온 예측 성능 비교
- 코로나-19 상황에서의 심리적 수용과 의도적 반추의 매개효과
- 성격평가질문지 증보판 반응왜곡지표의 상대적 효율성 비교
- 편마비 환자의 수면의 질, 사회적지지, 낙상효능감이 우울에 미치는 영향
- Forecasting Method for PM10 Concentrations in Seoul, with Adjustments for the Count Time Series Distribution and Excess Zeros
- Demand Systems of Private Tutoring in South Korea
- 데이터마이닝과 통계적 기법에 의한 대학의 취업 및 진로 만족도에 대한 순차적 분석
- Piecewise Logistic Regression for Cluster Randomized Controlled Trial of Health System Interventions
- 유럽 탄소배출권 시장과 에너지 시장 사이의 변동성전이
- 적응집락추출에 의한 보정추정에 대한 연구
- 기업경기실사지수를 이용한 경기인식의 비대칭성 분석
추천 논문
-
이보람(Boram Lee), 곽수영(Sooyoung Kuag), 양원호(Wonho Yang), 전상일(Sang il Jun), 김정수(Jung-su Kim), 이기영(Kiyoung Lee) 한국환경보건학회 한국환경보건학회지 제43권 제6호 2017.12
-
김호현, 양지연, 이청수 한국실내환경학회 한국실내환경학회지 7(2) 2010.06
-
차진순 기초과학연구원 조선자연과학논문집 5(2) 2012.06
-
Pengyu Li, Liwei Mi, Yuanyuan Liu 한국공업화학회 Journal of Industrial and Engineering Chemistry 81(0) 2020.01
-
Manpreet Kaur Aulakh, Bonamali Pal, 한국공업화학회 Journal of Industrial and Engineering Chemistry 80(0) 2019.12