Jörg Lehmann, PhiN 86/2018: 1

PhiN 86/2018: 1

Lassen sich Emotionen in Texten vermessen? Die Quantifizierung von Emotionen in der englischsprachigen Reiseliteratur zu Indonesien

Are Emotions Measurable in Texts? The Quantification of Emotions in English-language Travel Literature on Indonesia
On the basis of twelve travel narratives – all of them describing journeys to Indonesia – a quantitative analysis of emotion categories and emotion sequences as well as an examination of the association of emotions with locations and persons in these texts is presented. This study introduces the methodology of the quantification of emotions by means of emotion lexica, describes the current state of the art of computer-assisted emotion analysis and discusses the insights and findings of such an approach as well as its shortcomings and challenges.

1 Einführung

Im Projekt "Die Affekte der Forscher", gefördert durch die Volkswagen-Stiftung, arbeiten Primatologen, Ethnologen und Literaturwissenschaftler zusammen, um die Rolle von Emotionen in der Wissenschaft zu erforschen und zu untersuchen, wie subjektives Erleben von Emotionen objektiv erfasst werden kann. Neben der Analyse affektiver Reaktionen professioneller Beobachter im Feldforschungsprozess steht dabei die fächerübergreifende Entwicklung und Erprobung neuer Methoden und Modelle der Wissensproduktion im Zentrum des Forschungsprojekts. Eine besondere Herausforderung stellt dabei die Aufgabe dar, wie Emotionen in verschiedenen Formen von Feldforschungsberichten (Reiseliteratur, Ethnographien, Primatologenberichte) analysiert werden können. Neben der hermeneutisch-qualitativen Untersuchung von Texten werden dabei die Reichweite psychologischer Emotionskonzepte und auf ihnen aufbauende quantitative Verfahren in der praktischen Anwendung getestet. In der vorliegenden Arbeit wird auf der Grundlage eines kleinen Korpus von Reiseliteratur folgenden Forschungsfragen nachgegangen:

PhiN 86/2018: 2

1. Lassen sich Emotionen in Texten klassifizieren und quantifizieren?

2. Können für verschiedene Emotionskategorien Verlaufskurven über den Text hinweg nachgezeichnet werden?

3. Lassen sich Muster der Kategorisierung und Sequenzialisierung innerhalb eines Genres identifizieren?

4. Korrelieren die Emotionskategorien mit bestimmten Orten oder Personen?

Im Rahmen des Projekts "Die Affekte der Forscher" bildete Indonesien als Region einen Schwerpunkt, insofern aktuell dort forschende Ethnologen und Primatologen im Zentrum des Forschungsprojekts standen. Um Erkenntnisse aus einer interdisziplinär vergleichenden Lektüre von Zeugnissen der Reiseliteratur, der Ethnologie und der Primatologie gewinnen zu können, lag es aus literaturwissenschaftlicher Sicht nahe, reiseliterarische Texte als Untersuchungsgegenstand auszuwählen, die Indonesien als Reiseziel beschreiben. Die Darstellung dieses Landes in der Literatur dient hier einer exemplarischen Untersuchung der affektiven Dimension des Genres "Reiseliteratur" im Hinblick auf Emotionskategorien und -sequenzen. Dabei wird in der Form von Emotionslexika auf von der Psychologie entwickelte Konzepte zurückgegriffen, die mit Hilfe computergestützter Verfahren für die Textanalyse operationalisiert werden. Durch die explorative Anwendung dieser Verfahren und die Abschätzung ihrer Leistungsfähigkeit für die Interpretation literarischer Texte begreift sich diese Studie als ein Debattenbeitrag hin zu einem umfassenderen, komplexeren und differenzierteren Verständnis von Emotionen in Sprache und Text.

2 Methodische Einführung

In der jüngeren Forschung zur Quantifizierung von Emotionen in Texten gibt es einen Übergangsbereich zwischen "Sentiment Analysis" und "Emotion Analysis". Grundsätzlich richtet sich "Sentiment Analysis" auf die Bestimmung der Valenz oder Polarität eines Textteils und damit auf die Klassifikation, ob dieser Textabschnitt eine positive, negative oder neutrale Wertigkeit aufweist. Die "Sentiment Analysis" setzt lexikonbasierte Methoden ein. In diesen Lexika wird einem Wort wie "good" ein positiver numerischer Wert, "bad" ein negativer numerischer Wert zugewiesen; steigernde oder abschwächende Begriffe wie "very" oder "less" erhöhen oder vermindern den numerischen Wert.

PhiN 86/2018: 3

Sentiment Lexika wie der in Harvard erstellte General Inquirer (Stone et al 1966), das auf WordNet basierende SentiWordNet (Esuli/Sebastiani 2006) oder das im Nebraska Literary Lab unter der Leitung von Matthew L. Jockers entwickelte "Syuzhet"-Lexikon (Jockers 2015) bilden den allgemeinen Sprachgebrauch ab und orientieren sich damit an der Perspektive der pragmatischen Linguistik. In ihnen sind auch Emotionsworte im engeren Sinn zu finden, denen ebenfalls Wertigkeiten zugewiesen werden: "love" erhält eine positive Wertung, "hate" eine negative; "stunning" weist eine positive Konnotation auf, "disappointing" eine negative.

Im Gegensatz dazu wurden Emotionslexika zumeist auf der Basis von psychologischen Theorien entwickelt. Grundsätzlich lassen sich hier zwei konkurrierende Herangehensweisen voneinander unterscheiden, die als evolutionär-funktional und neurokognitiv-dimensional bezeichnet werden können (ausführlich dazu Lehmann et al 2017). Die evolutionär-funktionale Richtung der Psychologie geht auf Charles Darwin zurück, der in seinem 1872 erschienen Werk "The Expression of Emotion in Man and Animals" (Darwin 1827) bereits in den Kapiteltiteln eine Reihe von Emotionen wie anger, joy, rage, terror, fear, pain, love usf. benennt und den Emotionsausdruck von Menschen und nichtmenschlichen Primaten miteinander vergleicht. Dieser Ansatz wurde später von Robert Plutchik aufgenommen und weiterentwickelt. Plutchik benennt joy, trust, fear, sadness, disgust, anger und anticipation als Basisemotionen (Plutchik 1980). Eine ganze Reihe von Forschern hat Plutchiks Konzept der Basisemotionen aufgenommen und reformuliert; die namhaftesten Vertreter unter ihnen sind Andrew Ortony, Paul Ekman, Nico Frijda und Klaus Scherer. Die Anzahl der Basisemotionen differiert dabei je nach methodischer Herangehensweise. So identifiziert Paul Ekman sechs voneinander diskrete Emotionen (anger, fear, sadness, enjoyment, disgust und surprise; vgl. Ekman 1999), während Klaus Scherer nicht weniger als 36 Emotionen unterscheidet (Scherer 2005). Eine Übereinkunft auf eine bestimmte Anzahl von Emotionskategorien gibt es bislang nicht. Dieser Ansatz bietet jedoch den Vorteil, eine handhabbare Anzahl von Basisemotionen zu benennen, denen die in den Emotionslexika aufgelisteten Begriffe zugeordnet werden. Darüber hinaus sind diese Emotionskategorien allgemein verständlich, rekurrieren sie doch auf sprachlich vermittelte Klassifikationen, die auch Nicht-Psychologen zugänglich sind. Zugleich aber öffnet diese Herangehensweise das Einfallstor für die Kritik an dieser psychologischen Schule, denn die Ableitung der Emotionen zielt auf in der Sprache angelegte Kategorien ab, für die es in der nichtsprachlichen Wirklichkeit kein stringent nachweisbares Gegenstück gibt. Daher wird gerade die für Linguisten und Textwissenschaftler attraktive Engführung von sprachlichen Kategorien und Emotionsanalyse auf dieser Grundlage als "a folk theory of psychology" (Russell 2005: 26) diffamiert.

PhiN 86/2018: 4

Auch die zweite psychologische Forschungsrichtung – die neurokognitiv-dimensionale – kann auf eine lange Tradition verweisen. Bereits 1896 entwarf der Leipziger Gestaltpsychologe Wilhelm Wundt in seinem "Grundriss der Psychologie" ein Verfahren zur strukturierten Beschreibung subjektiver Gefühle durch Introspektion, innerhalb dessen Emotionen verortet werden können: "In diesem Sinne lassen sich nun drei Hauptrichtungen feststellen: wir wollen sie die Richtungen der Lust und Unlust, der erregenden und beruhigenden (excitirenden und deprimirenden) und endlich der spannenden und lösenden Gefühle nennen" (Wundt 1896: 98). Dieser Ansatz wurde im 20. Jahrhundert durch Forscher wie Charles Osgood, James A. Russell, Margaret Bradley und Peter Lang aufgegriffen und in einem dimensionalen Modell zusammengefasst – einem System mit (mindestens) zwei Achsen, für die sich die Begriffe valence und arousal durchgesetzt haben. Dieses Modell wurde in jüngerer Vergangenheit auf neurowissenschaftlicher Basis validiert, da sich ein positives oder negatives Gefühl (valence) und der körperliche Erregungsgrad (arousal) gut messen lassen. Über eine oder mehrere weitere Dimensionen wie etwa tension (wie bei Wundt: spannend-lösend), potency (wie bei Osgood) oder dominance konnte aber keine Übereinkunft erzielt werden (Mehrabian 1980). Die Kritik, die gegen diesen Ansatz vorgetragen wird, fokussiert auf den hohen Abstraktionsgrad des Modells, das es nicht erlaubt zwischen dem Auslöser der Emotion und dem körperlichen Empfinden einer Emotion zu unterscheiden. Darüber hinaus stellt das dimensionale Modell die Forschung vor die Schwierigkeit, dass unterschiedliche Intensitätsgrade von Emotionen nicht stringent identifiziert werden können, fallen doch beispielsweise intensive Wut und intensive Depressivität auf der Arousal-Achse klar auseinander. Und schließlich führt die Verortung von Emotionen in einem nur zweidimensionalen Modell dazu, dass unterschiedliche Emotionen eben nicht klar voneinander differenziert werden können.

Bei der Anwendung von Emotionslexika muss daher immer eine basale methodologische Vorentscheidung getroffen werden: Werden Emotionslexika verwendet, die der evolutionär-funktionalen Richtung der Psychologie zuzuordnen sind – oder diejenigen der neurokognitiv-dimensionalen Forschung? Die fortwährende Konkurrenz (und gegenseitige Exklusion) der beiden psychologischen Schulen hat dazu geführt, dass es bislang bedauernswerter Weise nur ein einziges Emotionslexikon gibt, das die beiden Ansätze zusammenführt (Briesemeister et al 2011); da es aber deutschsprachig ist und in der vorliegenden Studie ausschließlich englischsprachige Texte analysiert werden, scheidet es aus. Das bislang umfangreichste englischsprachige Emotionsvokabular der neurokognitiv-dimensionalen Richtung umfasst zwar 13.195 Adjektive, Nomen und Verben (Warriner et al 2013), ermöglicht aber keine Emotionskategorisierung; zudem erfordert dieser abstrakte Zugang mindestens basale Statistikkenntnisse.

PhiN 86/2018: 5

Die Herangehensweise der evolutionär-funktionalen psychologischen Schule wiederum kann Literaturwissenschaftler und Linguisten nicht völlig überzeugen, denn es stellt sich die Frage, warum genau ein einzelnes Emotionswort lediglich einer einzelnen Emotionskategorie zugewiesen werden sollte, wo doch grundsätzlich von einer Polysemie der Begriffe auszugehen ist? Um ein Beispiel zu geben: Warum sollten Worte wie "family" oder "wedding ring" nur einer einzelnen Emotionskategorie zuzuordnen sein, ist doch offensichtlich, dass die emotionale Besetzung dieser Begriffe im Sinne von Saussures "Grundlagen der allgemeinen Sprachwissenschaft" vollkommen kontextabhängig ist. Vielmehr verhält es sich so, dass sich die in den Listen der Emotionslexika enthaltenen Begriffe nun einmal nicht einfach auf die Verknüpfung mit nur einer Emotion reduzieren lassen; der allgemeine Sprachgebrauch verweist eher – und hier wird wieder auf den eingangs erwähnten Übergangsbereich zwischen "Sentiment Analysis" und "Emotion Analysis" rekurriert – auf die Assoziation eines Begriffs mit mehreren Emotionskategorien zugleich. Wie an den beiden Beispielen "family" und "wedding ring" deutlich wird, erzeugen diese Begriffe eine ganze Reihe von Emotionsassoziationen und lassen sich nicht nur auf eine Verknüpfung reduzieren.

Der vorliegenden Arbeit wurde daher ein englischsprachiges Emotionslexikon zu Grunde gelegt, das auf Plutchiks acht Basisemotionen anticipation, joy, surprise, trust, anger, disgust, fear und sadness basiert. Den Probanden, die die einzelnen Begriffe bestimmten Emotionen zuordnen sollten (den Ratern), wurde die Möglichkeit gegeben, jeden Begriff einer oder mehrerer oder auch keiner Emotionskategorie zuzuweisen (Mohammad/Turney 2010; Mohammad/Turney 2013). Darüber hinaus wurden die Rater gebeten, die Assoziation eines Begriffs mit einem Sentiment ("positive" / "negative") vorzunehmen. So ist auf Basis eines Crowdsourcings ein Emotionslexikon mit dem Titel "National Research Council Canada (NRC) EmoLex" entstanden. Dieses Emotionslexikon umfasst 14.182 Wörter, wobei aber lediglich 6.468 dieser Begriffe mit Emotionskategorien und Sentiments verknüpft sind, während es alle weiteren Worte im Emotionsdiktionär nicht sind. Mit anderen Worten: Das EmoLex ermöglicht es, auch Begriffe zu identifizieren und zu quantifizieren, die nicht oder in nicht eindeutiger Weise mit Emotionen verknüpft sind; sie liefern damit einen Hinweis auf den Grad der 'Sachlichkeit' eines Textes. Die Tatsache, dass jeder Begriff auch mehreren Emotionskategorien (aber nur einem Sentiment) zugeordnet werden konnte, indiziert den pragmatischen Sprachgebrauch; beispielsweise wurde das Wort "refugee" nur mit der Emotionskategorie "sadness" verknüpft (aber mit keinem Sentiment), das Wort "scream" hingegen mit den Emotionskategorien "anger", "disgust", "fear" und "surprise" sowie dem Sentiment "negative". Auf diese Weise berücksichtigt das EmoLex die Polysemie der Begriffe.

PhiN 86/2018: 6

Im Ergebnis aber führt die Konzeption des EmoLex dazu, dass in der Auswertung ein einzelnes Wort mehrfach gezählt werden kann, d.h. es kann zu höheren Werten in mehreren Emotionskategorien gleichzeitig beitragen. Daher ist die Summe der in den Emotionskategorien angegebenen Quantitäten auch immer höher als die Anzahl der erkannten Worte, die mit einer Emotion assoziiert wurden. Verglichen mit anderen Emotionsdiktionären, in denen jedes Wort mit immer nur einer Emotionskategorie verknüpft wird, erzeugt das NRC EmoLex daher viel mehr "Treffer".

3 Zusammensetzung des Untersuchungskorpus

Das zu untersuchende Textkorpus umfasst zwölf Texte, die im Rahmen des Projekts "Die Affekte der Forscher" zusammengestellt, gescannt, einer optischen Zeichenerkennung (OCR) unterzogen und manuell korrigiert wurden (in alphabetischer Reihenfolge der Autorennamen: Barley 1988, Barley 1991, Beatty 2009, Hose/McDougall 1912, Iyer 1988, Koch 1979, McNamee 2008, Naipaul 1981, Naipaul 1998, O’Hanlon 1985, Severin 1997, Wallace 1869, Wright 1956). Die zwölf Autoren – allesamt Männer – vertreten dabei die angelsächsische Welt und stehen damit nicht für die ehemalige Kolonialmacht, d.h. die Niederlande: Unter ihnen sind neun Briten (Barley, Beatty, Hose, Iyer, McDougall, Naipaul, O’Hanlon, Severin, Wallace), zwei US-Amerikaner (McNamee und Wright) und ein Australier (Koch). Alle Darstellungen sind aus der Perspektive eines im Text mehr oder weniger präsenten autobiographischen Ich-Erzählers verfasst. Lediglich Pico Iyer, ein Brite indischer Herkunft, und V.S. Naipaul, dem in Trinidad geborenen indischstämmigen Literaturnobelpreisträger, können – unter Vorbehalt – nicht-westliche Blicke attestiert werden. Nigel Barley und Andrew Beatty sind zeitgenössische Anthropologen. Die Autoren der beiden Bücher, die 1869 bzw. 1912 erschienen sind, dürfen als Universalgelehrte aus der Etablierungsphase der wissenschaftlichen Disziplinen angesehen werden (Charles Hose: Verwaltungsbeamter, Zoologe, Ethnologe, geboren 1863; William McDougall: Psychologe und Instinktforscher, geboren 1871; Alfred Russel Wallace: Naturalist, Geograph, Forschungsreisender, Anthropologe, Biologe, geboren 1823). Brian Row McNamee, Redmond O’Hanlon und Timothy Severin lassen sich als Erforscher und Publizisten bezeichnen, Pico Iyer, Charles J. Koch, V.S. Naipaul und Richard Wright als Schriftsteller. Allein schon die Verschiedenartigkeit der genannten Berufe verrät die Heterogenität des Genres Reiseliteratur: Berichte von Forschungsreisen (Hose, McNamee, O’Hanlon, Severin, Wallace) finden sich neben ethnologisch-anthropologischen Beschreibungen (Barley, Beatty) und den Darstellungen literarischer Autoren (Iyer, Koch, Naipaul, Wright).

PhiN 86/2018: 7

Das Werk von Alfred Russell Wallace wurde 1869 publiziert, das von Charles Hose und William McDougall 1912 und das von Richard Wright 1956; alle weiteren Bücher wurden im Zeitraum zwischen 1979 und 2009 veröffentlicht. Die Texte sind schließlich unterschiedlich lang; die Spanne liegt zwischen 12.035 Worten bei Pico Iyer und 109.908 Worten bei Andrew Beatty.

4 Emotionskategorien in den zwölf reiseliterarischen Texten

Technisch funktioniert die Analyse eines Textes mit Hilfe eines Emotionslexikons folgendermaßen: Zunächst werden sämtliche Begriffe des Textes mit Hilfe des TreeTaggers (Schmidt 1997) in ihre Grundform (Lemma) gebracht. Der TreeTagger versieht die einzelnen Wörter des Ausgangstexts auch mit Part-of-Speech (PoS) Informationen. Das eröffnet die Möglichkeit, eine Reihe von Wortklassen aus der Analyse auszuschließen, die nicht die Funktion eines Emotionswortes annehmen können, etwa Konjunktionen, Bestimmungswörter, Präpositionen, Pronomen usf. So lässt sich bei der Quantifizierung die Zahl der erkannten und nicht erkannten Wörter genau bestimmen. In einem zweiten Schritt wird diese Lemma-Liste dann mit dem gewählten Emotionslexikon abgeglichen und eine Liste der erkannten Worte erstellt. Alle zwölf Texte des Untersuchungskorpus wurden auf der Basis des NRC EmoLex mit Hilfe der Statistiksoftware R ausgewertet.¹ Angesichts der obigen methodischen Ausführungen wird deutlich geworden sein, dass die erste Forschungsfrage ("Lassen sich die Emotionen in diesen Texten kategorisieren und quantifizieren?") klar mit "ja" zu beantworten ist. Die nachfolgende Tabelle zeigt eine Übersicht der prozentualen Anteile erkannter Worte im Hinblick auf die acht Emotionskategorien des NRC EmoLex. Diese Herangehensweise ermöglicht es, die sehr unterschiedlichen Textlängen zu berücksichtigen. Maximalwerte wurden dabei grün, Minimalwerte gelb hinterlegt.

PhiN 86/2018: 8

Bei der Durchsicht dieser Tabelle tritt zunächst einmal hervor, dass die unterschiedlichen Texte, was die relative Verteilung der Sentiments angeht, erstaunlich homogen sind; der Minimalwert für "positive" liegt bei 55%, der Maximalwert bei 67%, eine Abweichung von lediglich 22%. Auch bei den Prozentanteilen der Emotionskategorien tritt hervor, dass die Schwankungsbreiten bei verhältnismäßig umfangreichen Emotionskategorien "trust" und "anticipation" wenig ausgeprägt sind. Dagegen zeigt sich eine nennenswerte Divergenz in den Kategorien "disgust" (85% Abweichung), "joy" (68% Abweichung) und "fear" (53% Abweichung). Der Text von Naipaul weist fünf Extremwerte auf, der Text von O’Hanlon vier, der von Wright drei, und die Texte von Hose, Iyer und Koch jeweils zwei. In der Zusammenfassung hinsichtlich der erkannten bzw. nicht erkannten Wortgruppen treten deutliche Unterschiede hervor: O’Hanlons Text vereint die Spitzenwerte der überhaupt erkannten Worte sowie der erkannten, aber nicht mit einem Rating versehenen Begriffe ("Sachbegriffe") auf sich. Mit anderen Worten: Der Wortschatz von O’Hanlons Text entspricht dem des EmoLex am deutlichsten. Die höchste Quote nicht erkannter Worte liegt bei dem Text von Christopher J. Koch; er weist aber auch die geringste Quote an Funktionsworten auf. Der Text von Beatty weist die höchste Quote der mit Emotionskategorien assoziierten Worten auf; die Quantifizierung legt somit nahe, dass Beatty als Protagonist einer Emotionsethnologie anzusehen ist. Die letzte Zeile der Tabelle schließlich gibt den Prozentanteil jener Funktionsworte (Konjunktionen, Bestimmungsworte wie der, die, das, Zahlen, Präpositionen, Pronomen), die von vornherein von der Analyse ausgeschlossen wurden; hier weist der historische Text von Hose/McDougall die höchste Quote auf (35,5%).

Grafisch zusammengefasst lassen sich die Prozentanteile für die einzelnen Texte folgendermaßen darstellen:

PhiN 86/2018: 9

PhiN 86/2018: 10

PhiN 86/2018: 11

PhiN 86/2018: 12

PhiN 86/2018: 13

PhiN 86/2018: 14

PhiN 86/2018: 15

Abb. 1: Relative Anteile von Emotionskategorien in den zwölf untersuchten Texten

Die Grafiken zeigen, dass im Hinblick auf die Emotionskategorien über alle Texte hinweg keine herausragenden Unterschiede hervortreten: Weder unterscheiden sich die Texte deutlich im Hinblick auf die Sentiments, noch fallen die großen Variationsbreiten in den Emotionskategorien "disgust" und "joy" stark ins Gewicht, denn diese beiden Kategorien decken nur einen vergleichsweise geringen Anteil der acht Emotionskategorien ab. Bemerkenswert ist einzig die relativ große Abweichung innerhalb der Emotionskategorie "fear", die um ca. 53% zwischen Hoses Text mit 16,4% und Iyers Text mit 10,4% schwankt.

Dieser Befund eröffnet zunächst einmal die Möglichkeit der Unterstützung qualitativer Lektüren und der Überprüfung der Befunde am konkreten Text. Zugleich wirft er jedoch Fragen auf, zum Beispiel, wie die Ausprägungen und Unterschiede in den Emotionskategorien "disgust" und "fear" zu erklären sind: Inwiefern sind diese Emotionsanteile charakteristisch für Reiseliteratur? Wie sind die Gewichtungen von Prozentanteilen im Vergleich zu anderen Genres, etwa der Memoirenliteratur, einzuschätzen? Sind sie typisch für das Genre Reiseliteratur, oder aber typisch für autobiographisches Schreiben insgesamt?

PhiN 86/2018: 16

Wie sähe im Vergleich zu den hier untersuchten Texten die Verteilung von Emotionsworten in Reiseführern aus? Erklären sich die Variationsbreiten in Emotionskategorien wie "disgust" oder "fear" daraus, dass die Reisenden sich typischerweise mit diesen Emotionen auseinandersetzen müssen? Daneben macht der rein quantifizierende und wenig differenzierende Befund die Begrenzungen des gegenwärtigen Forschungsstands und die Limitationen des Einsatzes von Emotionslexika unmittelbar evident. So können zwar aus der Quantifizierung Hypothesen für die qualitative Analyse gebildet werden, aber die Verwendung von Lexika ermöglicht es nicht, den Kontext der Emotionswörter innerhalb des Satzes zu berücksichtigen und so beispielsweise zu identifizieren, mit welchem Sprecher die Emotionswörter verknüpft sind. Die Klassifizierung von Emotionswörtern kann komplexere Strukturen wie figurative Sprache (Metaphern, Ironie, Sarkasmus) oder Anzeiger von Irrealis (Modi, Wenn-Konstruktionen, Intentionsverben) nicht berücksichtigen. Die Orientierung/Polarität einer Emotion (positiv/negativ) kann kontextabhängig (domänenspezifisch) sein, was ebenfalls nicht beachtet werden kann. Schließlich stellt die Relationalität von Emotionen eines ihrer charakteristischsten Merkmale dar: Emotionen beziehen sich immer auf jemanden oder etwas; und es ist eben diese Relationalität, die mit dieser Herangehensweise nicht erfasst werden kann. Daher kann auch nicht der Frage nachgegangen werden, wessen Emotionen sich auf was beziehen.

Immerhin aber erlaubt dieses Textkorpus eine Einschätzung der Verzerrung, die durch Negationen herbeigeführt wird. Technisch wird dies durchgeführt, indem sämtliche Texte zunächst in Bigramme zerteilt werden und anschließend diese Bigramme zunächst nach den mit ihnen verknüpften Sentiments und daraufhin nach Negationswörtern untersucht werden. Bei der sich nun ergebenden Liste von Bigrammen, die beispielsweise aus dem Negationswort "not" und dem positiv besetzten Wort "like" bestehen, muss das Vorzeichen des Sentimentwerts umgedreht werden:

PhiN 86/2018: 17

Die folgende Grafik veranschaulicht die häufigsten Bigramme, die aus dem Negationswort "not" und mit positiven (rosa) oder negativen (grau) Sentiments verknüpft Worten gebildet werden. Die Bigramme "not like" und "not want" tragen dabei am stärksten zur Verzerrung bei und lassen den Text positiver erscheinen, als er tatsächlich ist.

Abb. 2: Die 20 häufigsten Worte in den zwölf untersuchten Texten, die auf "not" folgen

Diese Analyse kann nicht nur für Bigramme durchgeführt werden, die mit der Negation "not" gebildet werden, sondern auch für eine ganze Reihe weiterer Negationsworte. Für das untersuchte Textkorpus wurden sämtliche Bigramme analysiert, die die Negationsworte "not", "no", "never", "without", "don't", "doesn't" enthielten.

PhiN 86/2018: 18

Dabei zeigt sich, dass auch hier die Bigramme "Negation + like" und "Negation + want" die häufigsten Beispiele darstellen, aber auch die Bigramme "Negation + doubt", "Negation + worry".

Abb. 3: Die 20 häufigsten Worte in den zwölf untersuchten Texten, die auf Negationen folgen

An der Anzahl der Okkurrenzen wiederum wird deutlich, dass die Verzerrung durch Negationsworte insgesamt nur gering ist. 154 Vorkommen des Bigramms "Negation + like", 127 Vorkommen des Bigramms "Negation + doubt" etc. fallen dann nicht erheblich ins Gewicht, wenn man sich vor Augen fährt, dass die zwölf Texte insgesamt 1.152.879 Worte umfassen und die Erkennungsquote beim NRC EmoLex in der Spanne zwischen 26 und 32 Prozent liegt. Mit anderen Worten: äber alle zwölf Texte hinweg gesehen liegt die Verzerrung durch Negationsworte im niedrigen einstelligen Prozentbereich.

PhiN 86/2018: 19

5 Emotionssequenzen in den zwölf reiseliterarischen Texten

Bei der quantifizierenden Auswertung von Texten können einzelne Begriffe identifiziert und Emotionskategorien zugeordnet werden; dabei kann auch ihre relative Position innerhalb ihres Textes notiert werden – jedes einzelne Wort des Textes erhält fortlaufend eine Zahl. Die Positionen aller Worte, die einer bestimmten Emotionskategorie angehören, werden anschließend zusammengefasst; die auf diese Weise versammelten Werte bilden dann die Grundlage für eine grafische Aufbereitung in Verlaufskurven über den Gesamttext hinweg. Daher lässt sich auch die zweite Forschungsfrage ("Lassen sich für die verschiedenen Emotionskategorien Verlaufskurven über den Text hinweg nachzeichnen?") klar mit "ja" beantworten.

Für die zwölf untersuchten Texte ergeben sich folgende Verlaufskurven, hier wiederum auf der Grundlage der acht Emotionskategorien des NRC EmoLex:

PhiN 86/2018: 20

PhiN 86/2018: 21

PhiN 86/2018: 22

PhiN 86/2018: 23

PhiN 86/2018: 24

PhiN 86/2018: 25

Abb. 4: Sequenzen der einzelnen Emotionskategorien in den zwölf untersuchten Texten

In den Grafiken wird unmittelbar evident, dass es je Text individuelle Verlaufskurven gibt, die der qualitativen Lektüre wertvolle Hinweise geben. Das trifft etwa auf das rasche Nachlassen der Häufigkeit aller mit Emotionskategorien verknüpften Worte in Andrew Beattys "A Shadow Falls" nach den einführenden Kapiteln zu. Umgekehrt aber auch auf den starken Anstieg der Häufigkeit von Emotionsworten in den Schlusspassagen von Richard Wrights Werk. Und schließlich ebenfalls auf die starke Varianz und die Modulationswechsel in Charles Hoses "Pagan Tribes of Borneo". Die Grafiken zeigen desgleichen aber auch, dass alle Texte zusammengenommen im Hinblick auf ihre Verlaufskurven keinem gemeinsamen Muster folgen: Die Möglichkeit, typische Verläufe in der Verwendung von Emotionsworten zu identifizieren, wird hier nicht sichtbar; vielmehr folgt jeder Text mehr oder weniger einem individuellen Ablauf. Reflektiert man auf das hier untersuchte Genre und darauf, dass es sich um faktuale Literatur handelt, so ist nicht unbedingt zu erwarten, dass die Emotionssequenzen typischen Mustern folgen: Ein Reisender, der sein individuelles Erleben notiert und dabei dem Verlauf seiner Reise folgt, orientiert seine Darstellung dabei nicht an dramatischen Spannungsbögen, wie sie für die fiktionale Literatur zu erwarten sind. Da die Erkennung von Mustern in Emotionssequenzen in der jüngsten Forschung zu Emotionsverläufen selbst für Fiktionen je nach Genre kontrovers diskutiert werden (vgl. Reagan et al 2016 und Kim et al 2017a und 2017b), sollte hier hervorgehoben werden, dass die vorliegende Studie mit ihrem Fokus auf Emotionssequenzen in faktualem Erzählen Neuland betritt.

PhiN 86/2018: 26

Darüber hinaus muss einschränkend festgehalten werden, dass die Emotionssequenzen mögliche semantische Verschiebungen bei einzelnen Worten im Textverlauf nicht abbilden können. Die Konzeption von Emotionslexika bildet den pragmatischen Sprachgebrauch ab und ermöglicht daher lediglich statische Bedeutungszuschreibungen, während sich mit Saussure die Bedeutung eines einzelnen Begriffs relational aus dem Kontext des Zusammenhangs ergibt.

6 Mit Emotionen verbundene Orte und Personen in den zwölf reiseliterarischen Texten

Eine erste Studie zur "geography of emotions" wurde bereits von Franco Moretti und seinem Team vorgelegt und im Oktober 2016 publiziert. Das "Literary Lab Pamphlet" mit dem Titel "The Emotions of London" (Heuser et al 2016) hatte dabei allerdings mit zwei Herausforderungen zu kämpfen: Zum einen mit dem historischen Emotionsvokabular, das in den rund 5.000 britischen Romanen aus der Zeit zwischen 1700 und 1900 zu finden war, und das zu einer großen Diskrepanz in der Einschätzung zwischen den menschlichen Klassifikatoren und der Identifikation von Emotionsworten durch eine Maschine führte. Zum anderen zeigte sich bei dieser Studie, dass fiktionale Texte die Nennung öffentlicher Orte explizit dort vermeiden, wo die Handlung der Erzählung spielt und eine hohe Intensität von Emotionsbegriffen vorherrscht. Mit diesen beiden Schwierigkeiten muss sich die vorliegende Studie nicht auseinandersetzen: Zum einen entstammen zehn der zwölf untersuchten Texte aus der zweiten Hälfte des 20. Jahrhunderts, und es wird mit dem NRC EmoLex ein zeitgenössisches Emotionsdiktionär verwendet. Zum anderen gehört die Reiseliteratur der Gattung faktualer Erzählungen an, die gerade durch extratextuelle Referenzen und eine intrinsische Beziehung zwischen Emotionen und Orten charakterisiert wird.

Technisch ist die Analyse einer Korrelation von Emotionsworten mit Orten (oder Personen) vergleichsweise einfach durchzuführen. In einem ersten Schritt wird bei sämtlichen Texten eine sog. Named Entity Recognition (NER) vorgenommen; die erkannten Orte, Personen und Daten werden in separaten Dateien ausgegeben. Die Auswertung aller Angaben führt zur Bestimmung der Häufigkeit der genannten Entitäten über alle Texte hinweg. In einem zweiten Schritt wird dann eine keyword-in-context (KWIC)-Analyse durchgeführt. Dabei werden bestimmte Begriffe (hier Orte und Personen) mitsamt ihrem Kontext (hier: 15 Worte vor dem keyword und 15 danach) aus allen Texten ausgelesen und wiederum in eigenen Dateien abgespeichert. In einem dritten Schritt werden dann diese letzteren Dateien mit einem Emotionsdiktionär abgeglichen, d.h. es wird dieselbe Analyse durchgeführt wie für die einzelnen Texte auch.

PhiN 86/2018: 27

Bei der Analyse der zwölf reiseliterarischen Texte stellte sich zunächst heraus, dass die Ortsbegriffe, die am häufigsten über alle Texte hinweg genannt wurden, nicht Städtenamen, sondern Regionenbezeichnungen waren (Inseln, Nationalstaaten, Kontinente). Dieser Befund erklärt sich aus der Charakteristik des gewählten Textkorpus: Indonesien besteht aus einer Inselgruppe, die Autoren entstammen sämtlich der angelsächsischen Welt und stellen häufig Bezüge zwischen den Kulturen her, so dass der Raum Indonesien in einen globalen Kontext eingebettet wird.

Abb. 5: Die zehn häufigsten Regionenbezeichnungen über alle zwölf reiseliterarischen Texte hinweg

Wie zu erwarten war, steht bei den weniger häufig verwendeten Städtenamen die Hauptstadt Indonesiens an erster Stelle. Gefolgt wird sie in der Häufigkeit überraschenderweise von zwei Städten, die nicht zu Indonesien gehören, nämlich Singapore und London. Daneben ist die Verteilung der Häufigkeit von Städtenamen über die Texte hinweg ungleichmäßig. So finden sich unter den zehn am häufigsten genannten Städten zwei Orte, die jeweils nur in einem Text genannt wurden: Bengkulu mit 71 Nennungen in Nigel Barleys "The Duke of Puddle Dock" und Banyuwangi mit 55 Nennungen in Andrew Beattys "A Shadow Falls". Ferner ist auch die Häufigkeit der Nennung von Mekka bemerkenswert; dieser Ort wurde immerhin in sechs der zwölf Texte genannt.

PhiN 86/2018: 28

Abb. 6: Die zehn häufigsten Städtenamen über alle zwölf reiseliterarischen Texte hinweg.

Die beiden folgenden Tabellen zeigen nun die relativen Prozentwerte der erkannten Emotionsworte nach Emotionskategorie je Ort. Maximalwerte wurden dabei grün hinterlegt, Minimalwerte gelb.

Deutlicher als bei der Analyse der Emotionskategorien für die einzelnen Texte treten hier bestimmte Orte dadurch hervor, dass sie Maximal- und/oder Minimalwerte auf sich vereinen: Borneo tritt durch den niedrigsten Wert in der Emotionskategorie "joy" hervor, Sarawak und Bali vereinen jeweils mehrere Minimal- und Maximalwerte auf sich.

PhiN 86/2018: 29

Bei den Städtenamen tritt nicht etwa der am häufigsten genannte Ort Jakarta hervor, sondern die Städte Mekka und Banyuwangi.

Insgesamt tritt die durchweg positive Beurteilung (Sentiments) der Regionen hervor, wobei bei Borneo der niedrige Wert für die Emotionskategorie "joy" überrascht. Das positive Gesamtbild wird durch die niedrigen Werte in den Emotionskategorien "disgust" und "sadness" für Sarawak unterstrichen; für Bali kann der niedrige Wert bei "anticipation" als Ausreißer angesehen werden. Die positiven Assoziationen der Regionen England und Europe sind dagegen am schlüssigsten durch die Herkunft der Autoren zurückzuführen. Noch wesentlich aussagekräftiger sind die mit den Städten verbundenen Emotionen: Hier überraschen die ambivalenten Sentiment-Bewertungen bei den Städten Bengkulu und Banyuwangi, die ja lediglich nur in jeweils einem anthropologischen Buch zu finden sind. Die am stärksten positive besetzte Verknüpfung mit Emotionen freilich findet sich bei Mekka; diese resultiert aus den starken Werten in den Emotionskategorien "joy" und "trust" (und niedrigen Werten in "anger", "disgust" und "fear"), die wohl auf die positiven Assoziationen der muslimischen Gesprächspartner der Autoren zurückzuführen sind.

PhiN 86/2018: 30

Abb. 7: Mit Regionen und Orten assoziierte Emotionskategorien am Beispiel von Borneo, Jakarta und Mekka.

Wesentlich komplexer als die mit Emotionen verbunden Orte gestaltete sich die Auswertung der Korrelation von Emotionskategorien und Personen. Dies liegt an der ungleichmäßigen Verteilung von Personennamen über alle Texte hinweg, was angesichts der Streuung der wenigen Texte über einen langen Zeitraum nicht überraschen kann. Der Name "Alfred Russel Wallace" ist mit 673 Nennungen der häufigste, er findet sich aber nur in vier Texten. Einer davon, Timothy Severins "Spice Islands Voyage", führt ihn allein 650 Mal auf, begibt sich das Buch doch auf die Spuren des historischen Entdeckers und Geographen. Textübergreifend treten neben Wallace nur noch zwei Personen besonders häufig hervor: Sukarno, der erste Präsident Indonesiens von 1945 bis 1967 (246 Nennungen in sieben Texten), und Suharto, zweiter Staatspräsident von 1967 bis 1998 (lediglich 56 Nennungen in drei Büchern).

PhiN 86/2018: 31

Letztere Zahl ist als sehr ungewöhnlich einzuschätzen, wurde doch der weit überwiegende Teil der Bücher während Suhartos Diktatur publiziert, d.h. nach 1979. Das wirft die Frage auf, ob die Autoren in ihren Texten explizit die Bezugnahme auf Suharto vermieden haben. Und noch überraschender ist, dass sowohl Sukarno als auch Suharto deutlich mit positiven Sentiments und Emotionen verknüpft sind. Bei der Einschätzung dieser beiden autoritären Herrscher, deren Regierungszeit durch Nationalismus und Militarismus sowie im Falle Suhartos durch das Massaker von 1965/66 geprägt war, hätte man von den angelsächsischen Autoren eine deutlich negativere Bewertung erwarten können. Daher stellt sich die Frage, wie die geringe Anzahl von Nennungen Suhartos interpretiert werden soll; abgesehen von den hohen Werten der Emotionskategorie "fear" wird diese Person ja auch nicht eindeutig kommentiert. Die positiven Assoziationen mit der Person Alfred Russel Wallace hingegen waren abzusehen, stellt doch das Buch von Severin diese historische Persönlichkeit rühmend ins Zentrum der Darstellung.

PhiN 86/2018: 32

Abb. 8: Mit Personen assoziierte Emotionskategorien.

Anders also als in der Studie zu den "Emotions of London" lassen sich die mit Orten und Personen assoziierten Emotionen stringent quantifizieren. Aus der überwiegend angelsächsischen Sicht der Autoren sind dabei nicht nur die ehemalige niederländische Kolonie Indonesien, sondern auch weitere Regionen und Orte wie England, Europa und Singapore oder Malacca weit überwiegend positiv besetzt. Die ambivalente Einschätzung der beiden Orte Bengkulu und Banyuwangi in den beiden anthropologischen Büchern müsste durch eine präzise Lektüre am Text überprüft werden. Darüber hinaus wäre vermutlich ein Vergleich dieser Emotionsassoziationen mit einer Gruppe von Texten von Autoren anderer Herkunft fruchtbar – niederländische, deutsche oder französische Autoren kämen wahrscheinlich zu anderen Bewertungen. Ein solcher Vergleich ist aber derzeit nicht durchzuführen, da es tatsächlich kein einziges Emotionsdiktionär gibt, das dieselben Emotionskategorien in mehreren Sprachen aufweist.

PhiN 86/2018: 33

Und schließlich ist – gerade im Vergleich zur Studie von Heuser et al – die schmale Datenbasis hervorzuheben, die lediglich einen anekdotischen Einblick gewährt: Zwölf Texte stellen selbstredend eine recht kleine Stichprobe dar.

7 Schlussbetrachtung

In der vorliegenden Studie wurde ein kleines Korpus reiseliterarischer Texte unter Zuhilfenahme eines Emotionsdiktionärs quantifizierend ausgewertet. Dabei ist auf der einen Seite deutlich geworden, dass Emotionsworte in Texten quantifiziert, kategorisiert, sequenzialisiert und mit Orten und Personen korreliert werden können. In dieser Hinsicht entsprechen die Resultate den Aufgabenstellungen und Herausforderungen, die sich das Projekt "Die Affekte der Forscher" gesetzt hat. Auf der anderen Seite wurde in den vorangehenden Absätzen jedoch deutlich, dass der maschinelle Abgleich von Texten und Emotionsdiktionären für sich genommen häufig unzureichend ist. Zwar liefert er wertvolle Hinweise für die qualitative hermeneutische Analyse, essentielle Fragen im Hinblick auf Emotionen können auf diese Weise aber nicht beantwortet werden. Als ein Anforderungskatalog für die Vermessung von Emotionen in Texten können daher folgende Fragen formuliert werden: Wessen Emotionen werden untersucht? Auf wen oder was sind die Emotionen eingedenk ihres stets relationalen Charakters gerichtet? Gibt es Emotionen, die typisch für Forscher sind – wie Neugier, Lust ("libido sciendi") und das Gefallen am intellektuellen Abenteuer – und lassen sich diese daher von den emotional regimes anderer Menschen unterscheiden? Sind Begriffe wie "Neugier" und "Wißbegier" als Emotionen zu betrachten? Und wie können jenseits einzelner Emotionskategorien komplexere Phänomene wie "Empathie" verstanden werden? Besteht die Einfühlung nicht aus einer spezifischen Konfiguration von Emotionen, die allesamt durch soziale Teilhabe charakterisiert sind, während andere Emotionen (wie disgust, anger oder fear) gar nicht vorkommen können, da sie sozial aversiv sind?

Darüber hinaus hat die Beschäftigung mit methodischen Fragen in diesem Projekt psychologische Emotionskonzepte im Hinblick auf die Quantifizierung von Emotionen in Texten einem Praxistest unterzogen und dabei die Insuffizienz dieser Herangehensweisen deutlich gemacht. Die Ansätze der beiden derzeit dominanten psychologischen Forschungsrichtungen können insbesondere im Hinblick auf die Polysemie der analysierten Begriffe bislang nicht überzeugen, und das in dieser Studie explorativ erprobte Verfahren einer Quantifizierung von Emotionswörtern kann ein wichtiges Merkmal von Emotionen – ihre Relationalität und damit ihre Verortung im Kontext – nicht erfassen.

PhiN 86/2018: 34

Jenseits des hier vorgestellten, rein quantifizierenden Vorgehens ist jedoch zu erwarten, dass in naher Zukunft Forschungen im Bereich des machine learning ertragreiche Ergebnisse liefern werden, eröffnen doch neuronale Netze die Möglichkeit, kategorisierte Emotionswörter im Kontext einzelner Sätze oder ganzer Textabschnitte zu analysieren und so komplexere Fragen nach der Relationalität von Emotionen zu beantworten, als dies mit einer reinen Auszählung einzelner Begriffe möglich ist. Die Verortung von mit Emotionen assoziierten Worten im Satzzusammenhang verspricht hier ertragreiche Antworten auf die Frage "Wer fühlt was im Bezug auf wen oder was?" (vgl. dazu ausführlich den Ausblick in Lehmann et al 2017) und eröffnet so die Chance, beispielsweise den Verlauf von Emotionen über den Text hinweg nachzuzeichnen, die eindeutig dem Erzähler zuzuordnen sind. Auf diese Weise wird die Frage nach den "Affekten der Forscher" bzw. im Rahmen dieser Studie den Emotionen der autobiographischen Ich-Erzähler der Reiseliteratur präziser nachgegangen werden können. So vielversprechend diese Perspektive vor dem Hintergrund der hier vorgestellten textanalytischen Ergebnisse auch klingen mag, gilt es doch, sich stets vor Augen führen, dass Emotionen ein hochkomplexes Phänomen darstellen. Unter den vielen Ausdrucksmöglichkeiten von Emotionen stellen Text und Sprache nur einen Zugang dar, der mit anderen Indizes wie Prosodie, Gesichtsausdruck, Körpersprache oder Peripherphysiologie verknüpft werden sollte.

Bibliographie

Barley, Nigel (1988): Not a Hazardous Sport. London: Pengui.

Barley, Nigel (1991): The Duke of Puddle Dock. Travels in the Footsteps of Stamford Raffles. New York: Henry Holt.

Beatty, Andrew (2009): A Shadow Falls. In the Heart of Java. London: Faber & Faber.

Briesemeister, Benny B. / Kuchinke, Lars / Jacobs. Arthur M. (2011): "Discrete emotion norms for nouns: Berlin affective word list (DENN-BAWL)." In: Behavior Research Methods 43(2), S. 441–448. DOI: 10.3758/s13428-011-0059-y.

Darwin, Charles (1827): The Expression of Emotion in Man and Animals. London: John Murray. Online abrufbar unter http://darwin-online.org.uk/converted/pdf/1872_Expression_F1142.pdf.

Ekman, Paul (1999): "Basic Emotions." in: Handbook of Cognition and Emotion, hg. von Tim Dalgleish und Michael J. Power, Chichester: John Wiley & Sons, S. 45–60. http://dx.doi.org/10.1002/0470013494.ch3.

PhiN 86/2018: 35

Esuli, Andrea / Sebastiani, Fabrizio (2006): SentiWordNet: A Publicly Available Lexical Resource for Opinion Mining. In: Proceedings of the Fifth International Conference on Language Resources and Evaluation (LREC-2006), Genova: European Language Resources Association, S. 417-422. Siehe http://sentiwordnet.isti.cnr.it/.

Heuser, Ryan / Moretti, Franco / Steiner, Erik (2016): The Emotions of London. Literary Lab Pamphlet 13, Stanford. Online abrufbar unter https://litlab.stanford.edu/LiteraryLabPamphlet13.pdf.

Hose, Charles / McDougall, William (1912): The Pagan Tribes of Borneo, a Description of their Physical, Moral and Intellectual Condition with some Discussion of their Ethical Relations, with an Appendix on the Physical Characters of the Races of Borneo by A.C. Haddon. 2 vols, London: MacMillan & Co. Ltd.

Iyer, Pico (1988): Video Night in Kathmandu. And Other Reports from the Not-So-Far-East. New York: Alfred A. Knopf.

Jockers, Matthew L. (2015): Syuzhet: Extract Sentiment and Plot Arcs from Text. Siehe https://github.com/mjockers/syuzhet.

Kim, Evgeny / Padó, Sebastian / Klinger, Roman (2017a): "Investigating the relationship between literary genres and emotional plot development." In: Proceedings of the Joint SIGHUM Workshop on Computational Linguistics for Cultural Heritage, Social Sciences, Humanities and Literature, Vancouver, Canada: Association for Computational Linguistics, S. 17–26. Online abrufbar unter http://aclweb.org/anthology/W/W17/W17-2203.pdf.

Kim, Evgeny / Padó, Sebastian / Klinger, Roman (2017b): "Prototypical Emotion Developments in Literary Genres." in: Digital Humanities 2017: Conference Abstracts, Montréal, Canada: McGill University and Université de Montréal. Online abrufbar unter https://aclanthology.info/pdf/W/W17/W17-2203.pdf.

Koch, Christopher J. (1979): The Year of Living Dangerously, New York: St. Martin’s Press.

Lehmann, Jörg / Mittelbach, Moritz / Schmeier, Sven (2017): "Quantifizierung von Emotionswörtern in Texten." in: DARIAH-DE Working Papers Nr. 24, Göttingen: DARIAH-DE. URN: http://nbn-resolving.de/urn:nbn:de:gbv:7-dariah-2017-4-5. PURL: http://resolver.sub.uni-goettingen.de/purl/?dariah-2017-4.

McNamee, Brian Row (2008): With Pythons & Head-Hunters in Borneo. The Quest for Mount Tiban. Bloomington: Xlibris.

PhiN 86/2018: 36

Mehrabian, Albert (1980): Basic dimensions for a general psychological theory. Implications for personality, social, environment, and developmental studies. Cambridge: Oelgeschlager, Gunn & Hain, S. 39–53.

Mohammad, Saif / Turney, Peter (2013): "Crowdsourcing a Word-Emotion Association Lexicon." in: Computational Intelligence, 29(3), S. 436–465.

Mohammad, Saif / Turney, Peter (2010): "Emotions Evoked by Common Words and Phrases: Using Mechanical Turk to Create an Emotion Lexicon." in: Proceedings of the NAACL-HLT 2010 Workshop on Computational Approaches to Analysis and Generation of Emotion in Text, Los Angeles, S. 26–34.

Naipaul, V. S. (1981): "Indonesia: Usurpations." in: Among the Believers. An Islamic Journey, New York: Vintage / Random House, S. 295–387.

Naipaul, V. S. (1998): "Indonesia. The Flight of the N-250." in: Beyond Belief. Islamic Excursions Among the Converted Peoples, New York: Vintage / Random House, S. 1–129.

O’Hanlon, Redmond (1985): Into the Heart of Borneo. New York: Random House.

Plutchik, Robert (1980): "A general psychoevolutionary theory of emotion." In: Robert Plutchik, Henry Kellerman (Hrsg.), Emotion. Theory, Research, and Experience, Vol 1: Theories of Emotion, New York: Academic Press, S. 3–33.

Reagan, Andrew J. / Mitchell, Lewis / Kiley, Dilan / Danforth, Christopher M. / Sheridan Dodds, Peter (2016): "The emotional arcs of stories are dominated by six basic shapes." in: EPJ Data Science 5, S. 31–43. DOI: https://doi.org/10.1140/epjds/s13688-016-0093-1.

Russell, James A. (2005): "Emotion in human consciousness is built on core affect." in: Journal of Consciousness Studies, 12(8-10), S. 26–42.

Scherer, Klaus R. (2005): "What are Emotions? And How Can They be Measured?" in: Social Science Information, 44(4), S. 695–729. DOI: 10.1177/0539018405058216.

Schmid, Helmut (1997): "Probabilistic part-of-speech tagging using decision trees." in: New Methods in Language Processing, hg. von Daniel Jones und Harold Somers, Studies in Computational Linguistics. London, GB: UCL Press, S. 154–164.

Severin, Timothy (1997): The Spice Islands Voyage. The Quest for Alfred Wallace, the Man who Shared Darwin’s Discovery of the Evolution. New York: Carroll & Graf.

PhiN 86/2018: 37

Stone, Philip J., et al. (1966): The General Inquirer: A Computer Approach to Content Analysis. Cambridge: MIT Press 1966. Siehe http://www.wjh.harvard.edu/~inquirer/.

Wallace, Alfred Russel (1869): The Malay Archipelago: The Land of the Orang-Utan, and the Bird of Paradise. A Narrative of Travel, with Sketches of Man and Nature. London: Macmillan and Co.

Warriner, Amy B. / Kuperman, Victor / Brysbaert, Marc (2013): "Norms of valence, arousal, and dominance for 13,915 English Lemmas." in: Behavior Research Methods 45(4), S. 1191–1207. DOI: 10.3758/s13428-012-0314-x.

Wright, Richard (1956): The Color Curtain. A Report on the Bandung Conference. London: Dobson 1956.

Wundt, Wilhelm (1896): Grundriss der Psychologie, Leipzig: Engelmann 1896. Online abrufbar unter https://archive.org/download/b28108474/b28108474.pdf.

Anmerkungen

¹ Im Rahmen des Projekts "Die Affekte der Forscher" wurden mehrere Funktionen für die Statistiksoftware R entwickelt, um unter anderem auch das NRC EmoLex zur quantifizierenden Auswertung von Texten verwenden zu können. Diese R-Funktionen werden interessierten Forscher*innen unter einer CC-BY-3.0-DE-Lizenz kostenlos zur Verfügung gestellt; Anfragen sind über http://researchonaffectsintexts.pbworks.com an das Projekt zu richten.