네트워크 텍스트 분석을 활용한 산업 간 연관성 분석에 관한 연구: 한국경제 뉴스 기사를 중심으로
- 한국생산관리학회
- 한국생산관리학회 학술대회 논문집
- 2019년 추계학술대회
- 2019.11
- 28 - 28 (1 pages)
기존에 산업 간 연관성을 분석한 연구들은 대부분 투입산출표(Input-Output Table)를 기반으로 하여 네트워크를 구성하고 각 산업들의 Eigenvector 중심성을 계산해 중요도와 파급효과를 도출하였다. 투입산출표는 일정기간(보통 1년) 동안의 산업간 거래관계를 일정한 원칙에 따라 행렬형식으로 기록한 통계표로 경제구조 분석, 산업연관효과 측정, 정부의 경제정책 수립 등을 위해 작성한다. 국민소득통계, 국제수지표, 자금순환표, 국민대차대조표와 함께 5대 국민계정(National Accounts)을 구성하는 국가 기간통계로서 중앙 및 지방정부, 대학 및 연구기관 등에서 경제․산업 분석을 위한 기초자료로 다양하게 활용 된다. 그러나 여러 가지 장점에도 불구하고 투입산출표는 원자재가격 상승 등에 따른 상대가격의 급격한 변동이나 수입대체산업의 발전, 기술혁신의 진행, 새로운 산업의 진입이나 신제품 개발 등으로 생산의 기술구조가 크게 달라질 경우에는 산출량 예측 등 경제분석에 상당한 오차가 발생한다. 특히, 산업별로 산출하는 재화 및 서비스의 경제적 가치에 주된 초점이 맞춰져 있어 기술 혁신과 산업 간 융합이 빠르게 이루어지는 요즘 시대에 재화의 산출, 수요액만으로 서로 다른 산업이 연관된 정도를 측정하기엔 정량적 경제 가치를 평가하기 어려운 경우가 많다. 또한 각 산업 부문의 생산활동은 주생산물 이외에 부차적 생산물도 함께 생산하는 결합생산의 경우가 있기 때문에 통계 단위의 동질성(homogeneity)이나 투입·산출의 비례성(proportionality)이 비현실적일 수 있다는 한계가 있다. 이에 본 연구에서는 네트워크 텍스트 분석을 이용해 산업 간의 연관성을 분석하는 모델을 제안하고자 한다. 해당 산업과 관련된 텍스트에서 키워드를 추출해 타 산업의 키워드와의 동시출현(Co-occurrence)빈도를 weight로 하여 네트워크를 구성하고 연결중심성을 도출하였다. 분석 데이터로는 2014년부터 2016년까지 한국경제 뉴스 기사 9,601건과 2015년 투입산출표 실측표와 2016년, 2017년 투입산출표 연장표를 이용하였다. 본 연구를 통해 기존의 산업연관표의 가장 큰 한계였던 속도(기준년표 작성주기 5년)을 극복하고 재화의 경제적 가치만으로 반영하기 어려운 산업의 현실을 빠르게 반영한 연관성 분석이 가능할 것으로 기대한다.