Self-Repetition and East Asian Literary Modernity, 1900-1930
https://culturalanalytics.org/2018/05/self-repetition-and-east-asian-literary-modernity-1900-1930/
近代東アジアの新しい文学として、日本には私小説、中国にはロマン主義小説がある。この2つは、自伝的であること、心理的語りが重要であること、新しい文体を採用していることなどの共通点があり、近代文学において重要なジャンルだとされている。
統計分析を用いて、この二つのジャンルの特徴が反復だと示す。
反復が多い作品は語彙が貧しく情報量が少ないと考えられる。タイプ-トークン比やエントロピー、語彙多様性を測るためのユールのK値やギローのC値を用いて、私小説とロマン主義を、そうでない小説と比較する。
すると、私小説やロマン主義小説は他の作品と比べると語彙の多様性が少なく、繰り返しが多いことがわかった。
より細かい特徴を掴むため、思考や感覚動詞、一人称・三人称代名詞、句読点や機能語の比率を調べたところ、これらは私小説やロマン主義小説の特徴として表れていた。
思考や感情を表す語が増えるとエントロピーが減少するという関係が見られた。
私小説とその他の人気のある小説を統計的に識別することは可能である。
繰り返しという現象が観測されても、それをどう解釈するかは難しいので、特徴的なテクストを見てみる。
特に繰り返しが多い私小説を見ると、神経衰弱状態を描いたものが見られる。
コーパスの中で最も私小説的だったのは、武者小路実篤『お目出たき人』。これは狂気、自己中心的な精神を描いている。
中国文学については、知識がないので省略。
この論文を参考にしてちょっと私小説について書いてみたい。