상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
국가지식-학술정보

Construction of `Yonsei 20th Century Corpus"

Construction of `Yonsei 20th Century Corpus"

  • 0
커버이미지 없음

연세20세기 말뭉치는 20세기 이후 현대국어를 기술하는 사전을 편찬할 목적으로 접근 가능한 전자 텍스트를 최대한 수집하는 것을 목표로 하였다. “연세현대한국어대사전”은 기술의 대상이 되는 현대국어 어휘의 시간적 범위를 20세기 전반으로 확대한 것이다. 20세기 초의 국어와 현재의 국어가 다르다는 것을 전제로 할 때 사전에서 현대국어를 기술한다는 것은 20세기 이후의 국어 어휘의 통시적 변화를 기술하는 것과 같은 맥락이다. 20세기 100년을 10년 단위로 나누고 매체와 텍스트의 성격을 중심으로 신문, 잡지, 문학적 텍스트, 정보적 텍스트, 교과서의 대분류를 설정하여 지금까지 약 1억 4천 어절의 말뭉치를 구축하였다. 연세20세기말뭉치는 현재 상태에 고정되지 않고 구축 중인 말뭉치이며 20세기 초기의 신문, 정보적 텍스트 등 비어 있는 부분을 위주로 지속적으로 확장해 나가는 중이다. 말뭉치의 양이나 균형성의 측면에서 아직 미완성이고 검색 시스템의 기능이 단순하고 제약적이지만 말뭉치 온라인 용례 검색기에서 옛한글 입출력을 구현한 것이 처음이므로 연세20세기말뭉치가 20세기 국어 연구에 기여하는 바가 있을 것이다. 어휘의 통시적 변화 및 경쟁 관계, 외래어의 의미와 표기 분화, 품사 범주의 문법화 등 다양한 관점에서 연세20세기말뭉치를 국어 연구에 활용할 가능성에 대해 예를 보였다.

.

(0)

(0)

로딩중