상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
日本硏究 第38輯.jpg
KCI등재 학술저널

근대 일본 자료의 한자 입력에 관한 연구

A Study on the Electronic Transcription and Input of Chinese Characters in a Modern Japanese Text: Focusing on the Unknown Chinese Characters in Eiwajii (1873)

  • 34

본 논문에서는 근대어 문헌(종이 매체)인 『英和字彙』(1873)를 전자매체(전자텍스트화, 데이터베이스화)로 변환하는 과정에서 JIS X 0213 문자세트로 표현(입력)할 수 없는 한자에 대해 컴퓨터상에서의 표현(입력) 가능성에 관해 살펴 보았다. 이들 한자는 인쇄 상태의 불량으로 한자의 字形을 특정할 수 없거나 JIS X 0213에 실려 있지 않아 입력할 수 없다고 판단한 것인데 본 논문에서는 이들 총 44자의 한자를 「불명한자」로 명명하고 이들 한자가 어떤 한자인가를 특정하고 유니코드나 이체자로 입력하는 방법으로 전자텍스트화가 가능한가 검토한 것이다. 본 논문에서는 『英華字典』과 「유니코드 한자 이체자 정보 사전」을 조사하여 총 44字 가운데 37字의 한자 정보-字形, 유니코드 -에 관해 밝혀낼 수 있었다. 특히 위의 조사를 통해 字形을 특정할 수 있게 되었으며 字形이나 유니코드를 「Unicode文字ツール」를 이용하여 JIS X 0213 문자세트에서 표현(입력)할 수 있었다. 현재까지의 조사에도 불구하고 「불명한자」를 특정할 수 없어 표현(입력)할 수 없는 「불명한자」가 7개 남았다. 이에 관해서는 앞으로의 조사를 통해 밝혀가고자 한다.

In this paper, in relation to the process of converting Eiwajii (1873), a modern language text in hard copy, into electronic form (electronic text format, database format), Chinese characters that cannot be expressed (inputted) with the JIS X 0213 character set are discussed. Upon examination of the possibility of expressing (inputting) them on the computer, this study shows that these Chinese characters cannot be entered because they are not specified in JIS X 0213 due to their poor printing status, in addition to other reasons. This paper therefore reviews whether it is possible to convert them to electronic text. In this paper, by searching in Eikajiten and the Unicode Chinese Character Information Dictionary, it was possible to discover information on 37 Chinese characters out of a total of 44, including their character shape and Unicode status. Given that it was possible to specify Chinese character shapes through the above investigation, it was therefore also possible to express (input) these Chinese character shapes or their Unicode representation in the JIS X 0213 character set using 「Unicode文字ツール」. However, seven unknown Chinese characters that cannot be expressed (input) remain, because these unknown characters cannot be identified. We would like to overcome this issue through future investigation.

Ⅰ. 연구 내용

Ⅱ. 연구 방법

Ⅲ. 『英和字彙』 「불명한자」의 특정

Ⅳ. 특정 방법에 따른 「불명한자」의 분류

Ⅴ. 맺는말

로딩중