본 글은 SJ-RIKS 코퍼스 확장판(양 1억 1천 어절, SJ-RIKS Corpus Extension) 말뭉치를 활용하여, 기본 한자어 명사의 사용역을 구어 8개와 문어 6개 사용역에서 확인해 보는 데 목적이 있다. 그동안 한국어 어휘의 50% 이상 큰 비중을 차지하는 한자어에 대한 연구가 국내외를 통해 상당한 정도로 이루어져 왔다. 그런데 기본 한자어 명사의 사용 양상을 연구한 기존 연구들은 대개 ‘21세기 세종말뭉치’(약 1천만 어절)를 가공하여 사용해 왔다. 그렇지만 신뢰할 만한 연구 결과를 얻기 위해서는 대규모 말뭉치(1억 어절 이상)를 이용하여 조사할 필요가 있었다. 본고의 연구 대상 한자어는 기본 한자어 명사 198개이다. 본고는 대규모 말뭉치를 사용한 것뿐만 아니라 기존 연구에서보다 세분화된 총 14개의 사용역으로 분석 대상을 대폭 확장하였다. 즉, 구어는 ‘토론, 상담, 방송, 발표, 독백, 대화, 강의, 강연’의 8개 사용역이고, 문어는 ‘책(총 서류), 책(학술), 책(소설), 준구어(대본), 잡지, 신문’의 6개 사용역이다. 본 연구를 통해 발견한 내용은 크게 세 가지이다. 첫째, SJ-RIKS 코퍼스 확장판 말뭉치에서 기본 한자어 명사는 사용역별로 상당한 정도로 출현 빈도 차이를 보인다. 특히 기본 한자어 명사는 구어의 ‘발표’, 문어의 ‘신문’ 사용역에서 많이 나타나고, 구어 ‘대화’와 문어 ‘책(소설)’ 사용역에서 현저히 적게 나타난다. 둘째, 그러나 개별 한자어 명사들의 최고-최저 출현 빈도 차이는 구어의 ‘발표’와 문어의 ‘신문’에서는 물론 다른 사용역에서도 큰 편차로 발견된다. 셋째, 구어와 마찬가지로 문어에서도 기본 한자어 명사의 유형 빈도와 출현 빈도는 사용역의 전체 어절 수와 상관관계가 없는 것으로 분석되었다.
The goal of this research is to examine the actual use of basic Sino-Korean nouns in eight spoken and six written registers using the SJ-RIKS Corpus Extension (approximately 110 million syllables). To date, studies on Sino-Korean words, which account for more than 50 percent of Korean vocabulary, have been conducted from various perspectives. In previous studies, the usage patterns of basic Sino-Korean nouns have mainly been processed using the 21st century Sejong corpus (approximately 10 million words). However, in order to achieve reliable research results, there was a constant need to investigate using a large-scale corpus of more than 100 million words. The research objects analyzed in this paper are 198 basic Sino-Korean nouns. As well as the large corpus, we have significantly expanded our analysis targets to a total of 14 registers, which are more granular than in previous studies. In other words, spoken language consists of eight registers for speech, lectures, dialogue, monologues, presentations, broadcasting, counseling, and discussion; and written language consists of six registers for newspapers, magazines, quasi-colloquial (scenario), books (novels), books (academic), and books (total document). There are three main findings from this study. First, in the SJ-RIKS Corpus expansion corpus, the basic Sino-Korean nouns show the frequency difference by registers to a considerable and significant degree. In particular, the Sino-Korean nouns are frequently found in the spoken-language of ‘presentation’ and written-language of ‘newspaper’, and significantly less in the spoken-language of ‘dialogue’ and written-language of ‘fiction’. Second, however, the largest difference in the highest-lowest frequency of individual Sino-Korean noun is found in the spoken-language of ‘presentation’ and the written-language of ‘newspaper’ as well as in other registers with a slight difference. Third, as in spoken-language, it was analyzed that the type- and token frequency of basic Sino-Korean nouns in the written-language is not at all correlated with the total number of words in the individual register.
1. 서론
2. 연구 방법
3. 사용역별 검색 결과 및 논의(기본 한자어와 구어 사용역)
4. 사용역별 검색 결과 및 논의(기본 한자어와 문어 사용역)
5. 결론
(0)
(0)