Di-Lemmata

Aus Literatur Rechnen - Neue Wege der Textanalyse
Version vom 18. Oktober 2017, 16:33 Uhr von Berenike Herrmann (Diskussion | Beiträge)

(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Wechseln zu: Navigation, Suche
Unser LitRe-Wiki ist seit 2012 nicht eingreifend überarbeitet worden. Es bildet also den damaligen Stand ab. Um Weiterentwicklungen der digitalen Textanalyse abzubilden, sollen nun die Artikel peu à peu überarbeitet werden, und weitere Artikel hinzukommen.

Interesse? Haben Sie Lust, einen Artikel zu überarbeiten oder neu zu verfassen? Schreiben Sie uns! Auch Kommentare, Kritik oder Fragen sind willkommen: mailto:bherrma1@gwdg.de


Die Software di-lemmata ist ein Programm zur computergestützten Analyse neuhochdeutscher literarischer Texte. Die Hauptbestandteile sind lemmatisierte Wortlisten, auf deren Grundlage Vergleiche zwischen Werken und Autoren sowie Erstellung von Konkordanzen möglich sind. Das Tool ermöglicht durch automatische Arbeitsschritte quantitative Textanalysen.

Allgemeine Voraussetzungen

Das Programm di-lemmata ist eine browserbasierte textanalytische Software, die für jeden kostenlos zugänglich ist. Eine Registrierung ist dabei nicht nötig. Die Benutzeroberfläche ist komplett in der Programmiersprache JavaScript geschrieben, die auf qooxdoo basiert, einem innovativen Entwicklungssystem für browsergestützte Internet-Anwendungen. Zur Nutzung des Programms muss die Funktionalität des JavaScripts im Browser aktiviert sein.

Da das Programm webbasiert ist, muss der Browser gewisse Mindestanforderungen erfüllen. Um reibungslos mit der Software arbeiten zu können, werden folgende Browser-Versionen empfohlen:

  • Mozilla Firefox ab Version 1.5
  • Microsoft Internet Explorer ab Version 7
  • Opera ab Version 9
  • Apple Safari ab Version 3

Da die Bibliothek auf umfangreiche Datenbestände zugreift, die bei Bedarf über das Internet in den genutzten Browser geladen werden, wird eine DSL- oder eine andere schnelle Datenleitung im Netz benötigt. Mit einem ISDN- oder analogen Anschluss kann eine problemlose Nutzung nicht garantiert werden.

Zwar ist es möglich, einen ausgewählten Text als PDF herunterzuladen, eine Funktion zur Daten- bzw. Ergebnisspeicherung ist im Programm jedoch nicht enthalten und muss durch eigene Methoden (z.B. mittels Screenshot) erfolgen.

Detaillierte Beschreibung des Tools

Die Idee zu di-lemmata entstand Anfang der 1990er Jahre an der TU Manchester von Dr. Achim Beutner und Norbert Schröder. Zunächst ging es im wesentlichen darum, computerlinguistische Erkenntnisse und Verfahren bei der literaturwissenschaftlichen Untersuchung von Textkorpora einzusetzen. Im Laufe der Zeit entstand daraus ein vollwertiges Anwendungsprogramm, das im Prinzip von jedermann benutzbar ist, der sich für die maschinelle Analyse literarischer Texte interessiert und gängige Kenntnisse im Umgang mit Computern hat. Nachdem das Programm zunächst als ausschließlich PC-basierte Anwendung konzipiert wurden war, steht es seit 2008 in einer mit modernen Web-Technologien erstellten Fassung im Internet und wird auch nur noch dort weiterentwickelt.

Das Tool di-lemmata beinhaltet linguistisch erschlossene Texte, wodurch der gesamte Wortschatz dem Benutzer in der Bibliothek über lemmatisierte Wortlisten zur Verfügung steht. Auf dieser Grundlage lassen sich vielfältige Untersuchungsansätze bei der Arbeit mit literarischen Werken realisieren, wobei ein breites Spektrum an Sortier- und Filter-Optionen zur Unterstützung bereit steht.

Das Programm besteht aus folgenden vier Grundpfeilern:

  • Die Bibliothek (die Textkorpora)
  • Die Wortlisten
  • Vergleiche
  • Konkordanzen

Die Bibliothek

Die Bibliothek besteht aus insgesamt 8363 neuhochdeutschen Texten, gegliedert in Unterordnern und Ordnern zu 19 Autoren. Ein direkter Link führt zu einer Biographie des ausgewählten Autors. Sobald ein Text ausgewählt wird, erscheint dieser in einem dafür vorgesehenem Fenster (siehe Abb. 1: "Die Bibliothek").
Abb.1: Die Bibliothek

Die Wortlisten

Um literaturwissenschaftlich relevante Fragestellungen zum poetischen Wortschatz eines Dichters formulieren und überprüfen zu können, bietet di-lemmata den gesamten Wortschatz der im Programm erfassten Texte in lemmatisierten Wortlisten an. Dadurch werden Untersuchungen wie z.B die Verteilungen und Häufigkeiten der Hauptwortarten, Wortschatzvergleiche zwischen einzelnen Autoren oder eine detaillierte Erörterungen von Kontexten erst möglich.

Der Inhalt der Wortliste ist abhängig von dem in der Bibliothek ausgewählten Ordner/Unterordner bzw. Text. Ist in der Bibliothek z.B. der Ordner "Trakl" markiert, wird in der Wortliste (links oben) der gesamte Wortbestand des bei di-lemmata vorhandenen Trakl-Korpus angezeigt (siehe Abb. 2: "Wortliste des gesamtenTrakl-Korpus"); bei der Auswahl eines Unterordners erscheint eine entsprechend reduzierte Wortliste aus den vorhandenen Texten. Eine Wortliste auf Grundlage eines einzelnen Textes ist ebenfalls möglich.
Abb.2: Wortliste des gesamten Trakl-Korpus

In der Wortliste werden zu jedem vorhandenen Lemmata/Lexem im ausgewählten Textkorpus (im Beispiel die gesamten Werke Trakls) der Wortstamm, die Wortklasse und die Häufigkeit in dem ausgewählten Textkorpus ausgegeben. Die Sortierung nach diesen Kategorien ist möglich.

Im Textfenster (unterhalb der Wortliste) werden die Texte, die das in der Wortliste markierte Wort enthalten, sowie die jeweilige Häufigkeit angezeigt. Sobald einer der Texte angeklickt wird, erscheint dieser vollständig im rechten großen Fenster und markiert das zu suchende Wort aus der Wortliste. Im Beispiel wird das Wort sind im Gedicht "Romanze zur Nacht" aufgrund der markierten Beiträge in der Wortliste und im Textfenster angezeigt. Unterhalb des Textfensters wird die gesamte Anzahl an Lemmata und Lexeme des ausgewählten Korpus angegeben (Trakls Werke enthalten 3.989 Lemmata und 23.358 Lexeme).

Abb.3: Beschränkte Wortliste 1
Eine Vielzahl an Filter-Optionen (Trichter-Symbol) gibt dem Benutzer die Möglichkeit, die Wortlisten nach seinen der Fragestellung gerichteten Wünschen zusammenzustellen. Neben der Anzeige von Stamm- oder Vollformen kann die Anzeige auf Komposita und/oder zuvor markierten Einträgen zu beschränkt werden. So ist es z.B. möglich, neben der Anzeige von Stamm- oder Vollformen, die Anzeige auf Komposita und/oder zuvor markierten Einträgen zu beschränken. Des Weiteren können einzelne Wortklassen oder eine Mindestfrequenz eines Wortes festgelegt werden. Mittels einer Wildcard können Listeneinträge mit einem gewissen Muster definiert werden.
Abb.4: Beschränkte Wortliste 2

In der Abb. 3: "Beschränkte Wortliste 1" wurde der Inhalt der Wortliste auf Stammformen beschränkt, die auf *ung enden und eine Frequenz von mindestens 4 aufweisen. Im Hintergrund ist eine reduzierte Wortliste zu sehen, die alle Wörter enthält, die der Beschränkung gerecht werden. Soll nur die Wortklasse Adjektiv angezeigt werden, enthält die Wortliste nur noch den Eintrag jung, der insgesamt 24 mal in den Werken Trakls vorhanden ist (siehe Abb. 4: "Beschränkte Wortliste 2"). Schon mit diesen vergleichsweise einfachen Mitteln kann ein lemmatisierter Wortschatz einfach, systematisch und vollständig untersucht werden.

Vergleiche

Einer der Hauptbestandteile des Programms ist die Option, Textkorpora auf Wortschatzebene miteinander zu vergleichen. Der Benutzer hat entweder die Möglichkeiten den gesamten Textkorpus eines oder verschiedener Autoren zu vergleichen oder einzelne Werke eines Autors oder verschiedener Autoren gegenüberzustellen. Wie bei den anderen Bestandteilen auch kann der Benutzer die Durchführung durch verschiedene Konfigurationsoptionen seiner Fragestellung anpassen.

Die Vergleiche von Werken unterschiedlicher Autoren ist ein interessantes Thema. So können z.B. die Gemeinsamkeiten und die Unterschiede in den Werken Schillers (Schiller als "Schüler") und in den Werken Goethes (Goethe als "Lehrer") verdeutlicht und analysiert werden. Jedoch sollte die Relevanz des Wortschatzvergleichs der Werke eines Autors nicht vernachlässigt werden. Der oft genannte Unterschied zwischen dem jungen und dem alten Stil Goethes (meist nur an wenig aussagekräftigen Zeilen bewiesen) könnte mit einem solchen Vergleich für neue Erkenntnisse sorgen und eine solide Belegbasis schaffen. Allerdings ist dies, aufgrund der noch nicht breitumfassten Textgrundlage, zurzeit nicht möglich.

Zur Veranschaulichung wird deshalb genauer auf die Frage eingegangen, ob sich die Thematik und der Stil Trakls in seinen Werken zu Lebzeit leicht geändert hat. Aufgrund des ähnlichen Umfangs und der beiden einzigen zu Lebzeiten erschienen Texte, werden zum Vergleich die beiden Werke "Gedichte" (1913) und "Sebastian im Traum" (1915) herangezogen. Zunächst werden aus der Bibliothek die zu betrachtenden Ordner bzw. Texte (Gedichte und Sebastian im Traum von Trakl) in das rechte große Fenster der Funktion "Vergleich" hineingezogen. Da in Trakls Werken die Adjektive eine große Rolle spielen, werden durch die Filterfunktion die Ansicht auf die zehn höchstfrequenten Wörter dieser Wortklasse beschränkt.
Abb. 5: Vergleich der zehn höchstfrequenten Adjektiven in Trakls Werken

In der Übersicht wird deutlich, dass die Adjektive dunkel, purpurn, still, silbern und grün in Trakls späterem Werk "Sebastian im Traum" erheblich an Bedeutung gewinnen, Adjektive im unteren Bereich wie alt oder schön hingegen verlieren an Relevanz. Konstant bleiben Farbadjektive wie schwarz, rot oder blau. Zur genaueren Erläuterung und weiteren Analyse von Trakls Werken siehe Kapitel 6: Beispielanwendung.

Konkordanzen

Ein weiterer Grundpfeiler von di-lemmata stellt die Konkordanz-Funktion dar. Dieses Werkzeug ermöglicht eine ausgedehnte Kontextuntersuchungen zu einem oder mehreren Schlüsselwörtern. Die Ergebnisse werden in Form von KWIC (Key Word in Contect) -Indizes angezeigt, deren Inhalte mithilfe flexibler Ein- und Abgrenzungsmöglichkeiten an individuelle Fragestellungen angepasst werden können.

Für die Erstellung einer Konkordanz muss der Benutzer über die Wortliste zunächst ein Wort oder mehrere Wörter als Schlüsselwort festlegen, von welchem die Umgebung analysiert werden soll. Möglich wäre auch die Markierung sämtlicher Wortlisteneinträge, dies ist aufgrund der benötigten Rechenleistung jedoch nur bei einer relativ kurzen Wortliste zu empfehlen. Zusätzlich ist es möglich den Inhalt des linken und rechten Kontexts zu definieren, indem zum einen der Umfang der Wörter beschränkt wird und zum anderen Bedingungen an die Wörter gestellt werden (bestimmte Wortklassen oder -formen). Das Ergebnis nennt sich Konkordanz und gewährt dem Benutzer einen Einblick in die Nutzung und der Kombination von Wörtern sowie die Gestaltung von Sätzen innerhalb des Werks.

Abb. 6: Konkordanz zum Substantiv Nacht
Trakl bedient sich Adjektiven um die dunkle Stimmung und Farben des Herbstes in seinen Werken richtig herüberzubringen. Um die Funktion der Konkordanz anschaulich darzustellen, wird exemplarisch der linke Kontext des häufig genutzten Substantives Nacht im Werk „Sebastian im Traum“ betrachtet. Dabei wird die Anzeige des linken Kontexts auf Adjektive beschränkt. Mithilfe der Funktion kann deutlich gemacht werden, welche Adjektive Trakl mit dem Substantiv "Nacht" verbindet (siehe Abb. 6: "Konkordanz zum Substantiv Nacht"). Für eine weiterführende Analyse siehe Kapitel 6: Beispielanwendung.

Daten-Einspeisung

Die Dateneinspeisung erfolgt durch die Entwickler von di-lemmata. Bevor die Daten veröffentlicht werden, werden die Texte mittels eines separaten Programms (Korpus-Manager) sorgfältig editiert und orthographisch gleich erschlossen, damit die Wortlisten, die während dieses Prozesses erzeugt werden, möglichst fehler- und widerspruchsfrei sind. Nur so kann bei der Funktion des Vergleichs die Kriterien empirischer Untersuchungen zu gewährleisten werden. Die Software beinhaltet ausschließlich Texte der neuhochdeutschen Literatur (18. – 20. Jh.). Aufgrund des Urheberrechtes können nur Werke von Autoren eingespeist werden, die seit 70 Jahren tot sind. Deswegen sind die Entwickler gezwungen, oft auf gemeinfreie Werke zurück zugreifen. Die Dateneinspeisung der Texte ist von Benutzern selbst nicht möglich. Sie können jedoch Wünsche gegenüber den Entwicklern äußern. Sofern die Textwünsche den Zielen und Intentionen von di-lemmata nicht widersprechen und solange sich dadurch keine Urheberrechtsverletzungen ergeben, werden diese in das Programm eingespeist.

Werke folgender Autoren sind für die Nutzer zurzeit zugänglich:

  • Gottfried August Bürger (Gedichte)

  • Johann Wolfgang von Goethe (Gedichte letzter Hand; West-östlicher Divan)

  • Friedrich von Schiller (Gedichte)

  • Friedrich Hölderlin (Gedichte)

  • Ludwig Uhland (Gedichte)

  • Joseph von Eichendorff (Gedichte und Epen)

  • August Graf von Platen (Gedichte)

  • Annette von Droste-Hülshoff (Gedichte)

  • Heinrich Heine (Gedichte)

  • Nikolaus Lenau (sämtliche Gedichte)

  • Eduard Mörike (sämtliche Gedichte)

  • Friedrich Hebbel (sämtliche Gedichte)

  • Gottfried Keller (Gedichte)

  • Conrad Ferdinand Meyer (sämtliche Gedichte)

  • Hugo von Hofmannsthal (Gedichte)

  • Rainer Maria Rilke (Gedichte)

  • Georg Trakl (sämtliche Werke)

  • Georg Heym (sämtliche Werke)

  • Alfred Lichtenstein (sämtliche Werke)

In einer neueren Version, die demnächst veröffentlicht wird, finden sich zusätzlich noch weitere Werke folgender Autoren:

  • Johann Peter Uz (Gedichte)
  • Gotthold Ephraim Lessing (Gedichte und gereimte Fabeln)
  • Christian Friedrich Schubart (Gedichte)
  • Ludwig Christoph Heinrich Hölty (Gedichte)
  • August Wilhelm Schlegel (Gedichte)
  • Ludwig Tieck (Gedichte)
  • Achim von Arnim (Gedichte)
  • Adelbert von Chamisso (Gedichte)
  • Friedrich Rückert (Gedichte)
  • Ernst Schulze (Gedichte)
  • Gustav Schwab (Gedichte)
  • Theodor Storm (Gedichte)
  • Paul Heyse (Gedichte)
  • Clara Müller-Jahnke (Gedichte)
  • Max Dauthendey (Gedichte)
  • Christian Morgenstern (Gedichte)
  • Theodor Däubler (Das Nordlicht; Attische Sonette)
  • Ernst Stadler (Gedichte)
  • Paul Boldt (Gedichte)
  • Ernst Wilhelm Lotz (Gedichte)
  • Klabund (Gedichte)

Die Daten (Texte und Wortlisten) sind in einer relationalen Datenbank (MySQL) auf dem Webserver gespeichert und werden mithilfe von SQL bei Bedarf per AJAX abgerufen. Die meisten Datenbankabfragen werden durch die Interaktion des Benutzers mit dem Programm gesteuert und deshalb dynamisch erzeugt. So werden bspw. die verschiedenen Optionen im Wortlistenfilter nach Anklicken von "OK" vom (lokal ausgeführten) Programm gebündelt an den Webserver übermittelt, der anhand dieser Informationen einen SQL-Befehl erstellt, mit dessen Hilfe die gewünschten Einträge aus der Datenbank selektiert und an das im Browser laufende Programm zurückübermittelt werden. Ähnliches gilt - in einfacherer Weise - auch für die Texte.

Benutzerfreundlichkeit und Transparenz

Benutzerfreundlichkeit

Für Neueinsteiger auf dem Gebiet der Textanalyse ist das Programm sehr gut geeignet, da es eine übersichtliche Benutzeroberfläche besitzt und jede einzelne Anwendung mit einer Hilfestellung verknüpft ist. Das Interface ist leicht zugänglich und selbsterklärend. Leider gibt es für Fortgeschrittene keinen professionellen Modus (wie z.B. bei AntConc), der anspruchsvollere Fragen zulässt.

Auf der Startseite des Programms gibt es eine Einführung zur Software, die auch als PDF zum Download bereit steht. Dort werden alle einzelnen Anwendungen detailliert erläutert und am Ende ein Beispiel für eine mögliche Anfrage am Tool gegeben. Innerhalb des Tools besteht zusätzlich die Möglichkeit zu jedem einzelnen Schritt eine kurze Erläuterung anzeigen zu lassen.

Zwar werben die Entwickler nicht für eine bestimmte Zielgruppe, jedoch ist es aufgrund der benutzerfreundlichen und sehr übersichtlichen Oberfläche besonders für die Nutzung innerhalb der Schule geeignet. Durch die wählbaren Sprachen für die Oberfläche (Deutsch, Englisch und Russisch) spricht das Programm eine größere Teilnehmerzahl als andere ähnliche Tools an. Zusätzlich kann es aus diesem Grund in verschiedenen Unterrichtseinheiten eingesetzt werden.

Transparenz

Die Entwickler deuten explizit daraufhin, dass di-lemmata als "work in progress" verstanden wird und aus diesem Grund die Texte unvollständig sind. Ziel ist es, die poetischen Werke möglichst vieler Autoren aufzunehmen und zu verarbeiten, so dass ein umfangreiches Bild des dichterischen Wortschatzes gewonnen werden kann. Den Nutzern ist es möglich, Verbesserungsvorschläge, Anregungen, Kritiken oder auch Text- bzw. Autorenwünsche anzugeben. Die Entwickler versuchen auf die verschiedenen Wünsche einzugehen.

Im Vergleich zu anderen Tools wie TextGrid oder AntConc ist die Transparenz der Ergebnisse bei di-lemmata negativ anzumerken. Der Nutzer hat keine Möglichkeit, das Ergebnis seiner Untersuchung durch Quellcodes oder Algorithmen nachzuvollziehen. Ebenso sind Weiterentwicklungen oder Fehlerbehebungen am Tool nicht einsehbar. Diese Aspekte benötigen weiteren Handlungsbedarf.

Fazit

Das Programm di-lemmata ist ein quantitativ arbeitendes Tool zur computergestützten Analyse von neuhochdeutschen Texten. Aufgrund der benutzerfreundlichen Oberfläche ist es besonders für Neueinsteiger zum „Ausprobieren“ geeignet, durch der genauen Vergleiche und Erstellung von Konkordanzen können jedoch auch wissenschaftliche Hypothesen getestet werden.

Mittels der lemmatisierten Wortlisten der Werke können aussagekräftige Vergleiche zwischen Autoren oder einzelnen Texten gewonnen werden. So können z.B. Stile verschiedener Autoren oder die Entwicklung eines Autors über mehrere Jahre analysiert werden. Sogar der Vergleich ganzer Epochen ist möglich, sobald ein umfangreiches Spektrum an Texten neuhochdeutscher Literatur vorhanden ist. Mithilfe der Funktion der Konkordanzen lässt sich der Kontext, in dem ein bestimmtes Wort oder ganze Sätze auftauchen, genauer betrachten.

Der Zeitaufwand der Analysen ist im Gegensatz zu umfangreicheren Tools relativ niedrig, da die Texte bereits eingelesen sind und die Funktionen durch wenige Klicks automatisch Ergebnisse präsentieren. Durch die Selbsterklärung des Tools können auch Neueinsteiger binnen kürzester Zeit repräsentative Ergebnisse erzielen. Durch die Funktionen des Vergleichs und der Konkordanz ist sowohl hypothesenprüfendes als auch exploratives Arbeiten möglich. Zur Prüfung von Hypothesen können die für die Untersuchung notwendigen Texte sowohl verglichen als auch den Kontext der Aussagen innerhalb der Werke angezeigt werden. Um eher hypothesengenerierend zu arbeiten, können durch die unkomplizierte Handhabung und automatische Ergebnisanzeige schnell und leicht Texte verglichen bzw. Kontexte genauer betrachtet werden. Die einfache Darstellung verhilft zu neuen Erkenntnissen und Ideenfindungen. Aufgrund der bereits lemmatisierten Wortlisten können die Untersuchungsergebnisse als zuverlässig betrachtet werden. Messbare Merkmale ermöglichen eine objektive Erhebung. Trotz unterschiedlicher Filter- und Konfigurationsoptionen ist der Interpretationsspielraum sowohl bei der Vergleichs- als auch bei der Konkordanzfunktion eher gering anzusehen.

Wird di-lemmata im direkten Vergleich zu anderen Tools gesehen, lassen sich sowohl Vor- als auch Nachteile finden. Positiv ist sicherlich die Benutzerfreundlichkeit und relativ einfache Handhabung des Tools im Gegensatz zu WMatrix oder CATMA. Die direkten Hilfefunktionen und meist selbsterklärenden Konfigurationen bieten dem Nutzer eine simple Oberfläche zur schnellen und übersichtlichen Ergebnisdarstellung. Besonders zum Einsatz in Ausbildungsstätten ist di-lemmata ein geeignetes Werkzeug zur computergestützten Textanalyse. Aufgrund der fehlenden Transparenz sowie des nicht vorhandenen Profi-Modus, ist es für weiterführende Untersuchungen jedoch eher ungeeignet. Ein weiterer negativer Aspekt bei di-lemmata ist, dass es im Vergleich zu anderen Tools wie WMatrix oder AntConc nicht möglich ist, eigene Texte hochzuladen und zu vergleichen. Die Benutzer sind auf die vorhandenen Texte angewiesen, können aber Textwünsche äußern. Ebenso ist das Tool in der Darstellungsart der Ergebnisse festgelegt, d.h. der Nutzer kann die Visualisierung der Ergebnisse seiner Untersuchung nicht anpassen, wie es z.B. bei Voyant möglich ist. Im direkten Vergleich mit anderen Tools zur Textanalyse ist di-lemmata aufgrund der begrenzten Möglichkeiten nur für eine begrenzte Erhebung geeignet und bedarf weiteren Entwicklungen und Modifikationen. Der Hinweis "work in progress" lässt auf solche Methoden schließen und wird womöglich schon in der nächsten Version (bereits in Entwicklung, Veröffentlichung unbekannt) zumindest zum Teil erkenntlich sein.

Grundsätzlich ist festzuhalten, dass die Wahl des Tools von der Fragestellung und den zu erwarteten Ergebnissen sowie deren Analyse und Auswertung abhängt. So eignen sich für eine schnelle Einschätzung und eine Übersicht von literarischen Texten meist eher quantitativ arbeitenden Tools. Durch die Möglichkeit, große Textkorpora zu vergleichen und zu analysieren, können oberflächenstrukturelle Untersuchungen durchgeführt werden. Aufgrund der identischen Orthographie und Lemmatisierung der Texte in di-lemmata, beinhaltet das quantitativ arbeitende Tool messbare Merkmale, die zu objektiven und zuverlässigen Ergebnissen führen. Qualitativ arbeitende Tools hingegen dienen eher zur Analyse von komplexeren Phänomenen wie Spannung oder Erzählperspektive. Untersuchungen zu solchen Aspekten benötigen tendenziell mehr Vorarbeit als quantitative Erhebungen. Sowohl die Operationalisierung von Merkmalen im Text als auch die Ergebnisinterpretation ist relativ zeitaufwendig. Des Weiteren muss darauf geachtet werden, dass sowohl bei der Annotation als auch bei der Ergebniserhebung und -interpretation subjektive Wahrnehmung des Untersuchers eine große Rolle spielen. Um Objektivität und Zuverlässigkeit der Ergebnisse zu gewährleisten, sollten vorher gewisse Regeln durchgesprochen werden, die es bei der Interpretation zu beachten gilt. (Die hier empfohlene Nutzung der Tools ist keine Grundregel. Der Nutzer sollte immer selbst entscheiden, welches Tool / welche Tools für seine Untersuchung geeignet ist / sind.)

Festzuhalten gilt, dass die Entwicklung solcher Programme aufgrund neuer weitreichen- der Möglichkeiten ein Fortschritt in der literarischen Textanalyse ist. Das Ziel von der einzelnen subjektiven Meinung hin zu empirischer Objektivität bei der Untersuchung von Texten kann durch Tools, die die nötigen Kriterien wie einen breiten Textkorpus, Transparenz, Benutzerfreundlichkeit, verschieden Untersuchungsmodi usw. erfüllen, erreicht werden (vgl. Rommel, 2004).

Beispielanwendung

Nachdem die grundlegenden Funktionen der Software vorgestellt wurden, werden im Folgenden zwei Hypothesen mithilfe von di-lemmata geprüft. Um eine Vorstellung von den Möglichkeiten des Tools zu erhalten, werden die in Kapitel 2 bereits angesprochenen Werke Trakls genauer betrachtet und analysiert.

Fragestellungen

Georg Trakl als Dichter des Expressionismus greift in seinen Werken auf Adjektive zurück, um die Stimmung und Farben des Herbstes genauer zu durchleuchten. Seine früheren Werke, die erst nach seinem Tod veröffentlich wurden, unterscheiden sich zu seinen nur wenigen zu Lebzeiten veröffentlichten Werken wesentlich in der Nutzung der Adjektive. In einem Brief an Erhard Buschbeck im Juli 1910 charakterisiert er den expressionistischen Reihungsstil seiner Werke vor 1913 als "meine bildhafte Manier, die in vier Strophenzeilen vier einzelne Bildteile zu einem einzigen Eindruck zusammenschmiedet". In seinen späteren Werken ab 1913 mischt er diesen expressionistischen Reihungsstil mit Einflüssen der Symbolik.

Hypothese 1: Trakls Werke ab 1913, die er noch zu Lebzeiten veröffentlichte, beinhalten mehr Farbadjektive zur Widerspiegelung der Stimmung des Herbstes als seine früheren Werken um 1909, die erst nach seinem Tod veröffentlicht wurden.

Hypothese 2: Der Ausdruck der Symbolik spielt in Trakls letztem Werk „Sebastian im Traum“ aus dem Jahr 1915 eine wesentliche Rolle.

Vorgehensweise

Zur Überprüfung der ersten Hypothese werden zunächst mithilfe der Vergleichsfunktion die Werke aus dem Jahr 1913 (Gedichte) und aus dem Jahr 1915 (Sebastian im Traum) gegenübergestellt, um die jeweils wichtigsten Adjektive zu analysieren. Auf Grundlage dessen werden dann die gesammelten Werke aus dem Jahr 1909 zum Vergleich hinzugezogen, um die Entwicklung der Farbadjektive von 1909 bis 1915 in Trakls Werken zu untersuchen.

Zur Überprüfung der zweiten Hypothese wird zunächst ein wichtiges Farbadjektiv im Werk "Sebastian im Traum" in Verbindung mit Substantiven betrachtet. Durch das Konkordanzprogramm kann der Kontext, in dem ein Farbadjektiv steht, genauer analysiert werden. Neben einer konkreten Verbindung mit einem Substativ wie bei Gegenständen oder natürlichen Dingen, sollte das Adjektiv auch in abstrakter Verbindung mit Substantiven auftauchen, um auf die Wichtigkeit der Symbolik für Trakl schließen zu können.

Durchführung

Um die bereits oben angeführten Beispielanalyse zu Trakls Werken in Kapitel 2 zu vertiefen, wird im Folgenden die Untersuchung fortgeführt bzw. genauer betrachtet. Zur Erinnerung: Als Dichter des Expressionismus widmet sich Georg Trakl in seinen Werken der Stimmung und der Farben des Herbstes. Die Werke Trakls sind aus diesem Grund geprägt von Adjektiven. Interessant ist hier die Frage nach der Entwicklung und Nutzung dieser Wortklasse. Zunächst wurde hierzu ein Vergleich zwischen den beiden einzigen zu Lebzeiten veröffentlichten Werken Trakls durchgeführt. Beim Vergleich von "Gedichte" (1913) und "Sebastian im Traum" (1915) wird deutlich, dass die Adjektive dunkel, purpurn, still, silbern und grün in Trakls späterem Werk "Sebastian im Traum" erheblich an Bedeutung gewinnen, Adjektive im unteren Bereich wie alt oder schön hingegen verlieren an Relevanz. Konstant bleiben Farbadjektive wie schwarz, rot oder blau.

In Werken Trakls überwiegen dunkle Bilder des Abends und der Nacht, des Sterbens, des Todes und des Vergehens. Diese trübe Stimmung bringt er besonders durch Farbadjektive zum Ausdruck. Um zu überprüfen, ob und wie sich die Nutzung von Farbadjektiven von früheren bis späteren Werken geändert hat, werden die Ausprägungen der wichtigsten Farbadjektive von 1909 bis 1915 in Abb. 7: "Vergleich der Farbadjektive in Trakls Werken von 1909 bis 1915" verglichen.
Abb. 7: Vergleich der Farbadjektive in Trakls Werken von 1909 bis 1915

Beim Vergleich der Farbadjektive wird die Bedeutung solcher in den späteren Werken Trakls deutlich. Werden nun der Anteil der Farbadjektive an den Adjektiven insgesamt betrachtet, wird folgendes Ergebnis sichtbar: Tabelle3.png


Werden weiterhin die Werke Trakls betrachtet, liegt es nahe, die Nutzung der Farbadjektive in Verbindung mit Substantiven genauer zu durchleuchten. Besonders im Werk "Sebastian im Traum" scheint kaum ein Substantiv ohne Adjektiv vorzukommen. Aus diesem Grund wird in der folgenden Konkordanz (siehe Abb. 8: "Konkordanz zum Adjektiv blau) der rechte Kontext des Farbadjektivs blau (das wichtigste Farbadjektiv im Werk) dargestellt, um exemplarisch die Relevanz solcher Wortklassen in Trakls Werken aufzuzeigen. Interessant ist hier die Frage, wie Trakl die Farbadjektive im Bezug auf die Substantive einsetzt, d.h. also welche Substantive mit dem Wort blau zusammen auftreten. Unterschieden wird dabei zwischen konkreten (auf Gegenstände und natürlichen Dingen bezogen) und abstrakten Einsätzen (Nutzung als Symbolik und Chiffre).

Abb. 8: Konkordanz zum Farbadjektiv blau

Insgesamt wird das Farbadjektiv blau 53 mal im Werk "Sebastian im Traum" eingesetzt. Neben der Verbindung mit Gegenständen und natürlichen Dingen, wird auch der abstrakte Einsatz des Adjektivs deutlich. So spricht Trakl z.B. von "ein[em] blaue[n] Lächeln", wobei das Adjektiv offensichtlich als Metapher gilt. In der folgenden Tabelle wird eine kurze Übersicht über die mit blau verbundenen Substantive gegeben. Tabelle4.png

Die Übersicht zeigt deutlich, dass Trakl das Adjektiv "blau" nicht nur in Verbindung mit für unseren Gebrauch "typischen" Substantiven bringt, sondern es auch für Symbolik und Metaphern einsetzt. Auffällig sind hier die hervorgehobenen Substantive, die Trakl in einem unkonventionellen Sinn mit dem Adjektiv blau gebraucht, z.B. "ein blaues Lächeln" oder "das blaue Rauschen". Wie der Nutzer letztendlich diese Verbindungen deutet, ist ihm freigestellt und bedarf Interpretationsfähigkeit.

Literatur

  • Basil, O. (2003). Georg Trakl. Mit Selbstzeugnissen und Bilddokumenten dargestellt (18. Aufl.). Reinbek: Rowohlt Verlag.
  • Beutner, A. (2008). Di-lemmata - Eine Einführung. Trégastel und Föhrden-Bahl.
  • Beutner, A. und N. Schröder (2012, 21. Januar). Interview, geführt vom Verfasser. Göttingen.
  • Killy, W. und H. Szklenar (1987). Georg Trakl: Dichtungen und Briefe, historisch- kritische Ausgabe (2. Aufl.). Band I in II. Salzburg: Otto Müller.
  • Rommel, T. (2004), Literary Studies. In: S. Schreibman, R. Siemens, J. Unsworth (Hrsgg.). A Companion to Digital Humanities. Oxford: Blackwell.
  • Schröder, N,, A. Beutner, D. Byurganovskiy, A. Puttfarken und G. Walsh (2008a), di-lemmata, Letzter Zugriff am 12.03.2012.
  • Schröder, N., A. Beutner, D. Byurganovskiy, A. Puttfarken und G. Walsh (2008b). Technische Hinweise. Letzter Zugriff am 12.03.2012.