학술저널
사람은 문서를 읽을 때 문서 전체를 읽지 않더라도 대표적인 단어를 보는 것만으로 정치, 경제, 교육, 스포츠 등의 분야를 정확히 인지한다. 이러한 단어를 분야연상어로 정의하고, 빈도수 조사를 통해 전자사전에 자동으로 구축한다. 이러한 분야연상어는 문서의 초기인식 시 어느 분야인지 분명하지 않거나 애매한 경우에도 문서를 읽어가면서 분야를 인지할 수 있도록 도와준다. 본 논문에서는 이러한 특성을 가지고 있는 분야연상어를 이용하여 시스템에 새로운 문서가 주어질 때 해당 문서의 분야정보를 추출하고, 분야연상어의 분포정보를 인간에게 그래픽컬 하게 보여줄 수 있도록 분야인식기를 설계하고 구현한다.
(0)
(0)