パターンが6つあるだけなの!?
小説とか映画って、みんな同じというわけじゃないですが、ある程度起承転結というか、似たような展開があるような気がします。登場人物紹介→課題提示→てんやわんや→課題解決、みたいな流れです。でも中には解決しないでアンハッピーに終わる話もあるし、ハッピーとアンハッピーがあざなえる縄のごとくからみあった複雑な話もあります。
そこで米国バーモント大学のAndrew Reaganチームは、オンライン図書館のプロジェクト・グーテンベルクにあるフィクション作品1,700本以上をテキストマイニングし、各物語の展開をハッピーさを指標にした軸でグラフ化しました。
ざっくり言うと、場面ごとの文章の中で、ポジティブな単語が多ければハッピー、ネガティブな単語が多ければアンハッピー、という具合です。たとえば「シンデレラ」ではお城の舞踏会はハッピー、継母にいじめられるのはアンハッピーと判定されるイメージで、上の画像みたいなアップダウンのグラフができます。
研究チームはさらに、グラフの動きが似た物語同士をグルーピングし、ストーリーのアップダウンにどんな傾向があるのかを明らかにしました。
その結果Reaganさんたちは、主なストーリー展開のパターンは6つしかないという結論に達しました。具体的には、こんな感じです。
・ひたすらハッピー:ありがちな立身出世物語
・ひたすらアンハッピー:「ロミオとジュリエット」
・ハッピー→アンハッピー:ギリシャ神話の「イカロス」
・アンハッピー→ハッピー:ありがちなスーパーヒーローもの
・アンハッピー→ハッピー→アンハッピー:ギリシャ悲劇の「オイディプス王」
・ハッピー→アンハッピー→ハッピー:「シンデレラ」
さらにReaganさんたちは、プロジェクト・グーテンベルクでの作品別ダウンロード数も併せて見ることで、上記のパターンのうちどれが人気なのかを調べてみました。その結果、よく読まれているのは「アンハッピー→ハッピー→アンハッピー」または「ハッピー→アンハッピー」だったそうで、みんな悲劇ものが好きみたいです。
どの作品がどんな展開になっているのか検索できるサイトも公開されています。
文学作品の展開パターン分類には、古くはアリストテレスも取り組んでいました。1849年にはフランスの批評家ジョルジュ・ポルティが「36の劇的境遇(dramatic situation)」という考え方を発表しました。
その後20世紀初頭、フィンランドの民俗学者アンティ・アールネがヨーロッパの昔話を収集して分類したものを米国のスティス・トンプソンが増補し、ふたりのイニシャルをとって「AT分類」なるものも生まれました。
またロシアの民話研究者ウラジーミル・プロップも多くの民話の登場人物や設定を整理し、作品を超えて共通する要素を指摘しました。
1995年にはカート・ヴォネガットも「ストーリーの形」について講演し、まさにReaganさんたちのようなアップダウンのグラフを描いています。
つまりこれまでの研究者が手作業や直感で導きだしていた分析を、Reaganさんたちが大量のデータとコンピュータで裏づけた、ともいえそうです。ただ実データを使っているからって、彼らの分析結果が絶対というわけでもありません。まず彼らが分析対象にした1,700作品は、多いといえば多いですが、文学作品全体から見ればほんのわずかでしかありません。
またその中身はプロジェクト・グーテンベルクからこれまで150回以上ダウンロードされた英語作品だけです。すべてが著作権切れの古い作品であり、現代小説などはふくまれていません。対象を違う言語・新しい時代にまで広げれば、上の6つとは違う展開パターンも出てくるかもしれません。
それに、ハッピー度だけでの分析は大ざっぱで、実際の作品がどれにあてはまりそうなのか言い当てるのは難しいです。たとえば、確かに「ロミオとジュリエット」は一貫してアンハッピー方向にまっしぐらの展開かもしれませんが、ふたりの出会いとか結婚とかの場面はハッピーなんじゃないでしょうか。
ともあれ、多くの物語の話の流れにはざっくりしたパターンがあることがデータで裏づけられたのは大きな一歩です。このパターンを応用したら、適当な人物設定を放り込むと小説を作ってくれちゃうジェネレータとかができそうですね。
source: arXiv via MIT Technology Review
Angela Chen- Gizmodo US[原文]
(miho)