『附音挿圖英和字彙』の漢字表示に関する研究
Research on the Kanji Inputs of “Fu-on Sōzu Eiwajii”: Towards the Construction of a Database
- 일본어문학회
- 일본어문학
- 日本語文學 第91輯
-
2020.1123 - 37 (15 pages)
-
DOI : 10.21792/trijpn.2020..91.002
- 0
近代語文献(紙媒体)をデータベースに構築するためには、「漢字入力」の問題は避けられないことである。2000年以降、JIS X 0213の制定により第三水準漢字、第四水準漢字、非漢字などが付け加えられJIS X 0208では入力できなかった漢字の多くは入力可能になった。 本稿では、筆者がJIS X 0208の漢字文字セットを用いて構築した『英和字彙』(初版、1873)のデータベースを対象に2000年制定されたJIS X 0213文字セットにより入力可能になった漢字はどのように分類できるのか分析した。入力可能と言っても紙媒体の漢字と入力できる漢字との間に「字形の隔たり」は依然残っている。また、JIS X 0213によっても入力できない漢字も相当残っている。ただし、JIS X 0213以外にもユニコードや異体字関係にある漢字を活用することにより電子テキスト化できる割合は高くなることが期待できる。 今後、JIS X 0213、ユニコード、異体字関係の漢字を用いることにより『英和字彙』(初版、1873)の語彙、特に入力できなかった語彙がどれくらい入力できるようになるのか検討したい。
The problem of kanji inputs is unavoidable for constructing modern documents into electronic texts. Since the 2000s, the establishment of JIS X 0213 has made available many kanji characters that could not be entered in JIS X 0208. In this paper, we analyze how the kanji characters that can be entered by JIS X 0213 can be classified based on the database of “Fu-on Sōzu Eiwajii”, which I constructed using JIS X 0208 . Even though kanji inputs were made possible, there is still a gap between the kanji characters written on the paper and the kanji characters entered on the computer. In addition, there are many kanji characters that cannot be entered due to JIS X 0213. However, it can be expected that the ratio of conversion into electronic texts will be increased by utilizing Unicode and variant characters in addition to JIS X 0213. In the future, I would like to examine how much JIS X 0213 can be used to input the vocabulary of “Fu-on Sōzu Eiwajii” especially the vocabulary that could not be entered.
(0)
(0)