日本語文學 第99輯.jpg
KCI등재 학술저널

근대 일본 자료의 한자 표현(입력)과 어휘의 상관관계 연구

A Study on the Correlation between Chinese Character Input and Vocabulary in Modern Japanese Data: Focussing on the Electronic Text Conversion of “Eiwaji”

DOI : 10.21792/trijpn.2022..99.006

現代にはコンピュータを利用して電子テキストの形で著作が行われるのが一般であるのに対して近代には活字を利用して著作が行われる。そのため、近代の文献資料を電子テキスト化する際には漢字の表現(入力)ができないことがありうる。 李慈鎬(2020)では、近代日本の代表的な英和対訳辞書である『附音挿圖英和字彙』(1873、以下『英和字彙』)を電子テキスト化する際、JIS X 0213を利用することによりJIS X 0208では表現できなかった大部分の漢字が入力可能になったことを報告した。また、李慈鎬(2022)では、李慈鎬(2020)で「その他」と分類した漢字についてその語形や読みなどを特定した。本稿では、『英和字彙』に載っている漢字の入力が可能になることにより語彙の入力はどのようになるのかという漢字と語彙との相関関係について分析した。 その結果、JIS X 0208では表現(入力)できなった漢字254字のうち、JIS X 0213とユニコードを用いることにより漢字は248字、単語は645語が新たに入力できるようになったことが分かった。これは、JIS X 0208では入力できなった漢字の97.6%、単語の98.3%に及ぶものである。ただ、まだ漢字6字(11単語)は電子テキストに表現できない実情である。今後、これらの漢字の特定および表現(入力)可能性を模索しなければならない。

Today, writing is generally done in the form of electronic texts using computers, whereas in modern times writing was done using printed characters. Therefore, when converting modern literature materials into electronic texts, it may be impossible to express (input) Chinese characters. Lee Ja-ho (2020) converted “Eiwaji” (1873) by using JIS X 0213. It was reported that most Chinese characters that could not be expressed in JIS X 0208 can now be expressed. In addition, Lee Ja-ho (2022) identified the word forms and readings of the Chinese characters classified as “other (unknown Chinese characters).” In this paper, I discuss how it will affect the input of expressions if it becomes possible to input the Chinese characters listed in the “Eiwajii”. As a result, out of 254 Chinese characters that could not be expressed in JIS X 0208, 245 Chinese characters and 645 words can be newly expressed by using JIS X 0213 and Unicode. This accounts for 97.6% of the Chinese characters and 98.3% of words that cannot be expressed in JIS X 0208.

1. 연구 내용

2. 연구 방법

3. 조사 개요

4. 「불명한자」와 단어와의 상관관계

5. 맺는 말

