A Quantitative Literary History of 2,958 Nineteenth-Century British Novels: The Semantic Cohort Method

今日は同じくStanford Literary Labのパンフレット4

A Quantitative Literary History of 2,958 Nineteenth-Century British Novels: The Semantic Cohort Methodを紹介する。

この論文は、1785-1900年のイギリス小説変化を3000近い作品のデータを用いて分析したものだ。

分析方法として、個々の単語ではなく、複数の近い意味の単語で形成される意味の場に着目して、歴史的変化を調べているのが特徴だ。これによって、一つの単語の変遷を見るよりも正確にテクストの変化を捉えられるだろう。

意味の場を構成する単語を選択するために、コーパス中での共起を用いている。

 

調査の結果として、elegant,mild,moral,sin,correct,partial,sentimentなど、抽象的・社会規範的・評価的・対立的な意味を表す語が19世紀イギリス小説において減少していることがわかった。

 

一方、go,come,face,red,down,hardなどの具体的で物理的な語は19世紀を通して増加していることがわかった。これらの語は描写的である。

 

この抽象の減少と具体の増加という現象を、トピックモデルを用いて検証したところ、裏付ける結果が得られた。

 

なぜこのような変化が起こったのか? それは、小説に書かれる空間が狭く私的な家庭内から広く公的な都市に変化したということがあり(ジェイン・オースティンディケンズがそれぞれを象徴する)、冒険物語やSFならさらに広い舞台を描く。小説が新しい社会を描くようになったことで、古い価値観による価値判断では充分に表現できなくなったのである。つまり、小説の抽象から具体への変化は、単に小説だけの変化ではなく、当時のイギリス社会の変化―工業化・都市化、そしてそれに伴う社会構造の変化―に対応しているのだ。

 

この論文は100年を超える期間でのイギリス小説の変化を、3000近い大量のテクストを用いて検証するというスケールの大きなもので、抽象から具体へという非常にわかりやすい対立構造を導き出し、しかもそれをイギリス社会の変化から説明することでインパクトを与えている。統計分析と文学解釈を結びつける方法論的な意識も強く、かなり高く評価できる。

 

複数の単語のグループを分析対象にするのは、やはり一つの単語を扱うよりも優れている点が多く、うまく扱えるなら良いだろう。