稚拙な統計処理で世界的な作家シェイクスピア作品が貶められていること (Computer-based Analysis and Shakespeare’s Work)

このブログの筆者がイギリス留学のときに撮った写真 

 

 2020 年の 4 月 17 日付けの Times Literary Supplement に、英文学を専門としている人にとって、興味深い記事が掲載されていたので紹介したい。この記事の筆者であるブライアン・ヴィカーズ (Brian Vickers) は 2002 年に出版されたShakespeare, Co-Author: A historical study of five collaborative plays の作者であり、The Collected Works of John Ford の編集主幹である。 また最近の出版物は、2019 年に出版されたThe One King Lear である。

 1986 年出版の『オックスフォード・シェイクスピア全集』 (Oxford Shakespeare Complete Works )と、その翌年に出版されたTextual Companion では、トマス・ミドルトン (Thomas Middleton) が『マクベス』(Macbeth) や『尺には尺を』 (Measure for Measure) の共作者であるとした。これは当時著名なシェイクスピア研究者であったスタンリー・ウェルズ (Stanley Wells) の共同編集者になった、若いアメリカ人研究者ゲーリー・テイラー (Gary Taylor) が主張したものであった。ブライアン・ヴィカーズ (Brian Vickers) は、テイラーの判断を、次のような文章で皮肉っている。

None of Taylor’s co-editors, and indeed no other critic, ever endorsed the ascription, but if you’re editor of the Oxford Shakespeare you don’t need anyone else’s approval.

(訳) テイラーの共同編集者や他の批評家たちは、この帰属の認定を支持しなかったが、オックスフォード・シェイクスピアの編集者になれば、(権威があまりにも強いので) 他の人の承認は必要としない。  ( )内は訳者の説明 

 2016 年出版の『新オクスフォード・シェイクスピア』 (New Oxford Shakespeare) では、テイラーの指導のもと、『マクベス』のミドルトンの分担部分が増え、『終わりよければすべてよし』 (All’s Well That Ends Well) も部分的にミドルトンの作とし、『タイタス・アンドロニカス』 (Titus Andronicus) の一場面も付加した。さらに『ヘンリー六世』 (Henry VI) 三部作すべてに、クリストファー・マーロウ (Christopher Marlowe) の影響があるとした。新しい全集はシェイクスピアの領地を縮小したためか、『フェヴァーシャムのアーデン』 (Arden of Faversham) をシェイクスピアの作品とし、これまでジョージ・ピール (George Peele) の作とされていた『タイタス・アンドロニカス』の一場面をシェイクスピアの作とした。

 テイラーはこのような作家の分担を「コンピュータによるテキスト分析」 (computerized textual analysis)で解明したとしているが、その分析はヴィカーズにすれば、およそ分析と呼べるものではなかった。

 ヴィカーズは、2017 年出版のテイラーたちの Authorship Companion の不備を指摘するために、二人の協力者を得た。一人はディビッド・アウアーバッハ (David Auerbach) で、彼はコンピュータの専門家であり、グーグルとマイクロソフトで働いていた。もう一人は Pervez Rizvi で、彼はソフト・エンジニアであったが、第二の職業として、テキスト批評家になった。彼ら三人で、Authorship Companion の再評価に取りかかった。

 ヴィカーズはテイラーの批判を始める前に、これまでのシェイクスピア研究の方法について述べている。1970 年代にミドルトンの作品と数多くの同時代の作品とを比較して、シェイクスピアの作品の中にミドルトンの影響が発見されたが、このような研究方法を言語学的 (linguistic) あるいは文学的 (literary) と呼ぶ。この分析には、量化理論 (quantification) の手法も入っているが、添え物にすぎなかった。当時の学者たちは、演劇を登場人物がお互いに反応する意味のある発話の連続 (a sequence of meaningful utterances) と考えていたのである。

 1960 年代のコンピュータの出現は、シェイクスピア研究に大きな変化をもたらした。コンピュータによるテキスト解析は、量化理論を使うが、言語の連続的性質を孤立した語彙素に分割した。コンピュータ解析は、二つのカテゴリーを扱い、一つは内容語(名詞など)、もう一つは機能語(前置詞、接続詞、代名詞など)である。

 コンピュータによるテキスト解析は、一人の作家の分析には有効に働くが、エリザベス朝の作品は多義的 (multivocal) なので難しい、とヴィッカーズは言う。劇の中で交わされる言葉や意味は、作家のものではなく、登場人物のものである。作家のスタイルがコンピュータによるテキスト解析で分かるとするには、しっかりした前提 (a massive assumption) が必要となる。

 機能語は無意識に使用され、作家の癖を表しているとされるが、この理論は間違いである。機能語の選択は、即席 (instantaneous)、あるいは意図的 (deliberated) であり、他の登場人物によって操られる (manipulated)。『オセロ』に登場するイアゴー (Iago) とオセロ (Othello) の言葉のやりとりに、その間の事情が如実に表れている。機能語と内容語が結びついて意味を創造するので、これら二つを分離することは、言語や文学の意味 (the meaning of language or literature) を理解する可能性をなくす。

 ヴィカーズによれば、コンピュータによるテキスト解析の基本的な弱点は、意味を無視することである。言葉の連続的相互作用を捨てることは、演劇の命とも言える意味の可能性や特別な意味を捨て去ることである (the possibility of meaning, and of those extra meanings that are the life of drama) 。現在のコンピュータ能力は、個々の言葉は処理できるが、まだ言語の全範囲を扱うことはできない。

 言語隣接ネットワーク (Word Adjacency Networks) という新しい手法は、劇作家は機能語によってのみ同定されるという、疑わしい仮定が元になっている。ヴィカーズが初めてShakespeare Quarterly (2016) に掲載された論文を読んだとき、これは奇妙な主張だと思った。そしてこのグループの出版物に対する持続的な吟味は、この印象を強めるだけであった (has only confirmed that impression) 。

 Shakespeare Quarterly (2016) に掲載された論文の四人の作者たちは、"with"、"one"、"and"、"in" という四つの機能語に注目して、シェイクスピアとトマス・デッカー (Thomas Dekker) の短い文を比較する方法で、デッカーとシェイクスピアの作品を結びつけている。

 数学者でないヴィカーズは、言語を電子回路のように扱い、クローディアスの欺瞞的な演説にある、でたらめな機能語連続が、シェイクスピアの言語選択を示すと信じている彼らには当惑する。ヴィッカーズがそれを出鱈目というのは、機能語は内容語を補足し、内容語に従っているからである。

 『新オックスフォード・シェイクスピア』チームの一員は、上記の不確かな方法論で『ヘンリー六世』第三部をシェイクスピアとマーロウの合作としている。

 彼らの主張とは反対に、1850 年にジェイムズ・シェディング (James Shedding) が、女性行末 (feminine ending) に着目して、『ヘンリー八世』 (Henry VIII) がシェイクスピアとフレッチャーの合作だと証明したが、これは今日まで正しいとされている。それは韻律学 (prosody)、すなわち女性行末に注目したからである。

 シェイクスピア研究で二つ目の確立した方法(テイラー一派ではなく、多くの研究家によって認められている)は、劇作家の言い回しを比較する方法である。その結果、『ヘンリー六世』第三部は、合作ではなく一人の作家からなることを示している。

 テイラーは「言語隣接ネットワーク」を支持していたが、彼はもっと単純な方法を好んでいた。彼は "micro-attribution" という方法を考案した。他の学者は二千語から五千語の文節を扱うのに、彼はたった四つの韻を踏んだ対句 (four rhyming couplets) を扱った。二つの連続する語を "bigram"、三つの連続する語を "trigram" として、テイラーはたった六十三語から九百五個のデータが得られたと主張した。このような杜撰な方法で、彼は『マクベス』に登場するヘカティー (Hekate) の言葉は、ミドルトンがつくったものだと主張した。どんな学者もこの主張は受け入れないだろう。 Wikipediaでは "micro-attribution" を次のように定義しているので参考にしてほしい。

The term micro-attribution (a form of data citation) is defined as “giving database accessions the same citation conventions and indices that journal articles currently enjoy”.

 Pervez Rizvi はテイラーの手法を、「このようなまがい物の科学手法は、科学者の集まる部屋からは笑って追放されるだろう」 (this faux-scientific method would be laughed out of the room at a scientific gathering) と痛烈に非難した。そのようなまがい物の科学で、テイラーは Authorship Companion の中で、『タイタス・アンドロニカス』の “Fly scene” と『終わりよければすべてよし』の部分をミドルトンの作としたのである。

 一見専門家的な Authorship Companion には多くの欠点がある。ディビッド・アウアーバッハはこの本を雑多な寄せ集めとしており、この本は統計学の基本原則を守っていないと批判している。「この本は人文学の研究者、編集者、出版社が、えせ科学方法論に騙されやすい不幸な証拠である」 (scholars, journal editors and publishers in the Humanities are prone to being abused by pseudo-scientific methods) 。

 ヴィカーズの次の指摘は、シェイクスピア研究者には重大なものである。すなわち、「『新オックスフォード・シェイクスピア』の作品の振り分けは間違っている。オックスフォード大学出版局は、英文学では世界的な出版社であるが、テイラーを編集者にしたのは失敗であった。この本で学生は教育を受け、素人はこの本を疑いもなく買っているので、オックスフォード大学出版局の罪は重い」。