Das interdisziplinäre Forschungsteam Natur & Staat hat sich zum Ziel gesetzt, ein innovatives Computerprogramm für die (semi-)automatische Metapherndetektion zu entwickeln. Der didaktische Nutzen und wissenschaftliche Mehrwert des Tools für die geisteswissenschaftliche Forschung und Lehre lassen sich folgendermaßen umreißen: Synchrone und diachrone Textanalysen des kontextuellen Metapherngebrauchs können z. B. bei vorliegenden großen Textkorpora rascher durchgeführt und erste wissenschaftliche Hypothesen evaluiert und modifiziert werden. Es können zudem auch textsortenübergreifende Analysen qualitativer bis quantitativer Art durchgeführt werden. Des Weiteren soll das Tool sowohl auf verschiedene Metapherntheorien als auch auf die jeweiligen Forschungsabsichten anpassbar sein. Der Fokus des interdisziplinären Vortrags liegt auf der geisteswissenschaftlichen Methodik, der didaktischen Vermittlung der statistischen Modellierung des Tools und insbesondere auf den bis jetzt erzielten Zwischenergebnissen unserer Arbeit.
Den namensgebenden Untersuchungsgegenstand bildet das neunbändige Volltextkorpus, das unter dem programmatischen Titel „Natur und Staat. Beiträge zur naturwissenschaftlichen Gesellschaftslehre“ (im Folgenden: Natur & Staat) u. a. von dem Zoologen Ernst Haeckel herausgegeben und im Zeitraum von 1903-1911 publiziert wurde. Die Bände liegen als Volltextdigitalisate in Frakturschrift vor.
Vorausgegangen war ein national und international stark rezipiertes Preisausschreiben, das 1900-1901 ausgeschrieben und vom bekannten Großindustriellen Friedrich Alfred Krupp (1854-1902) anonym finanziert wurde. Die Preisfrage lautete: „Was lernen wir aus den Prinzipien der Descendenztheorie in Beziehung auf die innerpolitische Entwicklung und Gesetzgebung der Staaten?“. Diskursanalytisch betrachtet, ist das Korpus u. a. eine Antwort auf die in verschiedenen wissenschaftlichen Disziplinen vorangegangene Rezeption der Theorien Charles Darwins im 19. Jahrhundert. Zusammen mit der sozialdarwinistischen Bewegung wurde ein neues Deutungsmodell des Menschen und seiner Stellung in der Welt vorbereitet und schließlich etabliert.
Natur & Staat bildet besonders aufgrund der Textsorte (vgl. Fix 2011) einen geeigneten Ausgangspunkt für die Metapherndetektion: Es handelt es sich um (populär-)wissenschaftliche Texte (vgl. Polenz 1999, 1981), die primär das Ziel verfolgen, Sachverhalte, Ideen, Theoreme auf der Basis einer sozialdarwinistischen Agenda zu reflektieren, argumentativ aufzubereiten und einem breiten Adressatenkreis zu vermitteln. Das Preisausschreiben öffnete den Weg für einen tiefgreifenden Wandel „ethisch“ genannter, auf eine Einflussnahme kollektiver „Entwicklungen“ abzielender Handlungsmaximen. Die Abhandlungen entwarfen Szenarien einer sozialdarwinistischen Governance von Bildung: einer Sitten- und Wertepolitik für das „Leben“ – mitsamt biotechnischen und eugenischen Implikationen (vgl. Gehring 2009).
Innerhalb des aufgezeigten Kontextes sollen Ausdrucksgestalt und semantische Funktion von sprachlichen Metaphern analysiert werden. Interaktionale Modelle mit ihrer binären Übertragungsstruktur fokussieren u. a. konventionalisierte, ubiquitäre Alltagsmetaphern. Eine wissenschaftliche Herausforderung in diesem Forschungsparadigma bilden jedoch die kühnen Metaphern.
Metapherntheorien, die die kühne Metapher ins Auge fassen, verorten sich innerhalb des hermeneutischen Paradigmas und legen das Primat auf das Besondere. Nur Metaphern, die besonders seien, seien laut Max Black (1954) für die Philosophie relevant, da nur sie eine erkenntnistheoretische Funktion hätten. Des Weiteren stellt er in der Folge von I. A. Richards (1936) fest, dass die Metapher zwei Bestandteile aufweise: Fokus und Rahmen. Beide bestünden mindestens aus einem Wort und sie seien interaktional, derart, dass ein System von Implikationen, welches dem Rahmen unterliege, auf das Implikationssystem des Fokus‘ rückbezüglich wirke. Die Übertragung der Implikationen geschehe auf der Basis von Ähnlichkeiten. Sie speise sich somit aus der immanenten Semantik des Implikationssystems, welches durch statistische Verfahren z. B. über selektionale Präferenzen für den Computer abbildbar gemacht werden kann.
Gehring (2011) erweiterte dann Blacks Interaktionstheorie, insofern sie den Kontextbruch als eine notwendige Bedingung der Metapher einführt, da aus diesem und dem Fehlen des wörtlichen Sinns der Interaktion die Metapher entstehe. Da aber nicht jede semantische Übertragung eine Metapher sei, weil man ansonsten in die Beliebigkeit abdriften würde, ist die Interaktion der beiden Entitäten, auch eine Interaktion der besonderen Art. Die Größe des Rahmens respektive des Kontexts der Metapher ist sowohl bei Gehring als auch bei Black variabel, könne allerdings durch eine Weglassprobe evaluiert werden. Einigkeit besteht überdies auch darüber, dass die Metapher nur in der Gesamtheit von Fokus und Rahmen bestehe. Weder hinreichende noch notwendige Bedingungen der Metapher seien hingegen, laut Gehring (2011), sowohl Bildlichkeit als auch lexikalische sowie grammatikalische Indikatoren, weil die Metapher deutungsoffen sei; auch schließt sie aus, dass es ein Kontinuum zwischen Begriff und Metapher gebe.
Metapher bezeichnet im Rahmen der konzeptuellen Metapherntheorie (Lakoff / Johnson 1980; Lakoff 1993; Goatly 2007; Kövecses 2015) zunächst ein zentrales kognitives Vermögen. Die Kernthese der konzeptuellen Metapherntheorie bildet die Annahme, dass eine unbekannte Erfahrung ( target domain) in Analogie zu einer bereits bekannten Erfahrung ( source domain) sprachlich konzeptualisiert wird. Dies betrifft beispielsweise vage Konzepte wie Emotionen (Kövecses 2003), Theorien und andere abstrakte Sachverhalte, Relationen (Johnson 1987) und Prozesse (Núñez 2014). Diese metaphorischen Übertragungsmuster lassen sich auch im Textkorpus Natur & Staat indexikalisch auf der Sprachoberfläche mit dem Fokus auf Lexemen, z. B. Genitivkonstruktionen ([[NP] der/des [NP]]), und weiteren usuellen Konstruktionen korpuslinguistisch eruieren und annotieren. Die Verteilung der metaphorischen Sprachphänomene ist dabei im Vergleich zu den bereits erwähnten kühnen Metaphern als ubiquitär (Paul 1909, Bühler 1934, Paprotte / Dirven 1985) einzustufen. Die entlehnten konzeptuellen und sprachlich umgesetzten Domänen können schließlich in einem zweiten Schritt hinsichtlich regelmäßiger Konzeptübertragungen zwischen den beiden Domänen systematisiert werden.
Seit einigen Jahren lässt sich eine verstärkte Entwicklung (zumeist überwachter) automatisierter Verfahren für die Identifikation und Interpretation von Metaphern beobachten. Diese Verfahren nutzen überwiegend als Grundlage für die Modellierung des Untersuchungsgegenstandes Metapher die bereits vorgestellte konzeptuelle Metapherntheorie von Lakoff und Johnson (1980). Dabei gibt es Unterschiede in der Zielsetzung einzelner Verfahren: Während einige Ansätze lediglich die metaphorische Verwendung bestimmter Konstruktionen (z. B. Subjekt-Verb-Objekt oder Adjektiv-Nomen) bewerten (Turney et al. 2011; Tsvetkov et al. 2013; Shutova 2013), weiten andere Verfahren eine solche Klassifizierung auf alle Inhaltswörter aus (Beigmann Klebanov et al. 2014; Dunn 2013). Darüber hinaus existieren Unterschiede in der Tiefe der Analyse. So wird bei einem Großteil der Verfahren die konzeptuelle Ebene ausgeblendet und Metaphern werden ausschließlich als Realisierungen auf der Sprachoberfläche identifiziert, wenn auch mit Methoden, die sich auf das Vorhandensein einer konzeptuellen Ebene stützen oder diese voraussetzen. Wenige Verfahren versuchen, metaphorische Abbildungen auf der konzeptuellen Ebene zu erkennen (Mason 2004; Shutova et al. 2013).
Neben der Wahl der untersuchten Metapherntheorie und der Ebene, auf der Metaphern erkannt werden, ist ein weiteres Merkmal bestehender automatischer Verfahren die Sprache der behandelten Texte. Diese ist – nicht zuletzt aus praktischen Gründen, wie dem Vorhandensein annotierter Korpora und weiterer Ressourcen wie vordefinierten Datenbanken zu Abstraktheits- und Konkretheitsbewertungen von Wörtern – üblicherweise Englisch. Für einige Verfahren existieren überwachte maschinelle Lernverfahren, die es ermöglichen, auf annotierten, englischen Daten ein Modell zu trainieren, welches durch zweisprachige Wörterbücher für die automatische Identifikation auf Texten anderer Sprachen anwendbar ist (Tsvetkov et al. 2013).
Für die Annotation sowohl kühner als auch ubiquitärer Metaphern verwenden wir zunächst WebAnno (Yimam et al. 2013), ein Web-Annotationsprogramm für mehrere Benutzer mit frei definierbaren Annotationsarten. Dazu setzen wir jeweils unterschiedliche Annotationsebenen ein. Zwei Benutzer mit geisteswissenschaftlicher Expertise im Bereich der Metapherntheorien annotieren dieselben vereinbarten Textabschnitte, um Vergleichswerte für ein Inter-Annotator Agreement zu erhalten. Dabei nutzen wir die Exportmöglichkeiten von WebAnno, um die Annotationsdaten der Nutzer sowie weitere linguistische Merkmale wie Wortarten zu exportieren, mit denen dann ein Inter-Annotator Agreement berechnet, sowie die automatische Weiterverarbeitung für die Identifizierung von Metaphern ausgestaltet werden können.
Hierfür testen wir zunächst in einer Pilotstudie, wie bestehende state-of-the-art Verfahren für ubiquitäre Metaphern (Tsvetkov et al. 2013; Beigmann Klebanov et al. 2014) auf deutschen, insbesondere historischen, Texten abschneiden. Dafür benötigte Ressourcen werden erstellt oder erweitert. Außerdem wird die Weiterentwicklung bestehender Methoden sowie das Entwickeln neuer Methoden vorangetrieben, um auch kühne Metaphern zu identifizieren. Die Identifikation solcher Metaphern stand bislang nicht im Vordergrund automatischer Systeme. Durch die Wahl des Korpus‘ ergeben sich weitere Herausforderungen, zum Beispiel eine ungenügende Abdeckung von Natur & Staat durch bestehende manuell erstellte Ressourcen wie etwa GermaNet (Hamp / Feldweg, 1997; Henrich / Hinrichs 2010), sowie ein Mangel an Vergleichskorpora für statistische Verfahren, die beispielsweise mittels Kookkurrenzen oder selektionaler Präferenzen Unterschiede zur „Standardsprache“ feststellen können.
Während mit dem ubiquitären Metaphernmodell somit eher implizite Mechanismen der sprachlichen Sachverhaltsperspektivierung, kurz: konventionalisierte Metaphern, in den Fokus rücken, wird das kühne Metaphernmodell besonders den strukturellen Rezeptions- und Gestaltungsprinzipien des Textes gerecht und vermag auf der Basis des vorgestellten Fokus- und Rahmenkonzepts die besonders markanten Sinnbezirke im Text in den Vordergrund zu rücken. Kühne Metaphern in theoretischen, argumentativen Texten heben sich deutlich von der diskursiv omnipräsenten Sprachstruktur ab: Sie weisen zugleich dadurch, dass sie einen Bruch mit der stilistisch homogenen Sprachstruktur erzeugen, erst auf eben diesen textuell gegebenen Sprachstandard hin und weisen zugleich aufgrund ihres semantischen Verdichtungspotenzials über diesen hinaus (Gehring 2011). Als Sinnbezirke auf der Sprachoberfläche rhetorisch inszeniert und umgesetzt, besitzen kühne Metaphern in Natur & Staat insbesondere epistemologisches Potenzial, indem sie neue Theoreme und Idee erst eine besondere sprachliche Gestalt zu geben vermögen.
Hinsichtlich der Annotation sowohl kühner als auch ubiquitärer Metaphern ist ein hohes Inter-Annotator Agreement notwendig; einerseits als Bestätigung für eine hinreichend gute Operationalisierung und Modellierung der verwendeten Theorie, andererseits um einen verlässlichen Goldstandard für das Training und die Evaluation automatischer Verfahren bereit zu stellen. Diesen Zwischenschritt und die daraus resultierenden Möglichkeiten für Geisteswissenschaften als auch Informatik werden wir in unserem Vortrag vorstellen.