상세검색
최근 검색어 전체 삭제
다국어입력
즐겨찾기0
152187.jpg
KCI등재 학술저널

BCCWJのブログレジスタ-における話し言葉と書き言葉の諸相

The Use of Spoken and Written Japanese in the Blog Register of BCCWJ

  • 13

近年、Webやコーパスを用いた日本語研究が増えてきている。国立国語研究所が2011年に構築した 󰡔現代日本語書き言葉均衡コーパス󰡕(BCCWJ)は日本語の書き言葉の研究の際に、最も多く利用されるコーパスの一つである。BCCWJは13のサブコーパスから構成されている。ただし、13のサブコーパスのうち、「ブログ」や「国会会議録」を書き言葉のコーパスとして位置づけることについては異論も多く、議論の余地がある。そこで、本稿は「ブログ」における話し言葉と書き言葉の出現頻度を分析することによって、話し言葉と書き言葉の資料としてのブログの位置づけを明らかにすることを目的とする。また、分析に際しては、ブログの記事を14のジャンルに分類して行うことにする。 分析結果によると、ブログにおいては、書き言葉のみではなく、話し言葉も多く使われており、しかも話し言葉の使用率が書き言葉のそれより高い。ただし、話し言葉と書き言葉の使用率は使用する語と表現によって、かつブログのジャンルによって大きく異なる。したがって、ブログを書き言葉の資料として用いること、それに基づいた分析結果を解釈する際には十分な注意が必要であることを論じた。

In recent years, Japanese studies using the web and corpus have been increasing. Balanced Corpus of Contemporary Written Japanese (BCCWJ), constructed by National Institute for Japanese Language and Linguistics in 2011, is one of the most frequently used corpora when studying written Japanese. BCCWJ has 13 sub‐corpora. However, among the 13 sub‐corpora, there are many objections to the positioning of “blogs” and “record of Diet proceedings” as written Japanese. The purpose of this paper is to clarify the position of blogs as corpus for spoken and written Japanese by analyzing the frequency of spoken and written Japanese in “blogs”. In the analysis, the contents of the blog will be classified into 14 genres. According to the analysis results, blogs use not only written Japanese but also spoken Japanese, and the usage rate of spoken Japanese is higher than that of written Japanese. However, the usage rates of spoken and written Japanese vary greatly depending on the words used and on the genre of blogs. This paper argues that blogs require careful attention when used as a corpus of written Japanese and when interpreting the results of analysis.

1. はじめに

2. 先行硏究

3. 調査対象と調査方法

4. ブログにおける話し言葉と書き言葉の混在の諸相

5. ブログにおける話し言葉と書き言葉の諸相

6. 結びに

로딩중