Word2Vec 모델을 이용한 ESG 점수 도출에 관한 연구
A Study of Extracting ESG Scores through Word2Vec Model: Methodological Suggestions for Quantitative Text Analysis Using Similarity from Unstructured Documents
본 연구는 비정형 텍스트의 가치 증대에 따라 텍스트 분석 모델링을 활용한 계량화 방법을 제안하였다. 기업에서 발행하는 ESG 보고서와 ESG 평가 기관인 한국지배구조원의 ESG 모범규준 문서간 유사도 분석방법을 활용한 ESG 점수를 도출하고 있다. 비정형 텍스트 분석 도구인 Word2Vec 모델을 통해 각각의 텍스트를 동일한 차원 크기로 구성하고, 중요도가 높은 주제어로 선별하였다. 다만, Word2Vec 모델은 하이퍼파라미터에 따라 주제어 결정에 변동성이 나타나는 특징이 있다. 따라서 반복 실험을 수행하여 최적의 파라미터를제시하였으며, 실험 결과 선행연구와 동일한 양상이 나타나 다시 한번 수치의 타당성을 확보하였다. 본 연구의ESG 텍스트 계량화 방법은 분석을 하는데 있어서 중복 및 누락 오류와 같은 휴먼 에러 발생을 방지하고, 프로그래밍화된 계산 방식은 1편의 보고서당 10초 이내로 ESG 점수를 빠르게 산출하는 기술적 강점을 지니고있다. 따라서 본 계량화 결과는 기존의 ESG 평가 방식과 대비하여, 또 다른 ESG 평가 도구를 발명함으로써기업 ESG 고유 특성을 분석하는 실증 연구의 지평을 넓힐 수 있을 것이다.
This study proposed a quantitative analysis method using text analysis modeling according to the importance of unstructured text. ESG scores are derived using a similarity analysis between ESG reports and ESG code of best practices in KCGS. Each text was configured in the same dimensions and constructed to select high important keywords by using a model of Word2Vec algorithm. Since the Word2Vec algorithm shows variability of topic words according to the hyper-parameter, as a result of the repeated experiment were performed to suggest optimal optimization of parameters and the same aspect as the previous study. Looking at the technically superior characteristics of this research methodology, ESG scores can be quickly calculated within 10 seconds per report, and the programmed method avoids the occurrence of human errors such as duplication and omission errors. Therefore, this quantitative text analysis method specifically is able to calculate and extract another ESG scores in contrast to the existing ESG evaluation method.
Ⅰ. 서 론
Ⅱ. 이론적 배경 및 주요 개념
Ⅲ. 연구방법
Ⅳ. 분석 결과
Ⅴ. 토론 및 시사점
Ⅵ. 결 론
참고문헌