Di-Lemmata

Aus Literatur Rechnen - Neue Wege der Textanalyse
Wechseln zu: Navigation, Suche

Kurzbeschreibung des Tools

Die Software di-lemmata ist ein Programm zur computergestützten Analyse neuhochdeutscher literarischer Texte. Die Hauptbe-standteile sind lemmatisierte Wortlisten, auf dessen Grundlage Vergleiche zwischen Werken und Autoren sowie Erstellung von Konkordanzen möglich sind.

Die Idee zu di-lemmata entstand Anfang der 1990er Jahre an der TU Manchester von Dr. Achim Beutner und Norbert Schröder. Zunächst ging es im wesentlichen darum, computerlinguistische Erkenntnisse und Verfahren bei der literaturwissenschaftli-chen Untersuchung von Textkorpora einzusetzen. Im Laufe der Zeit entstand daraus ein vollwertiges Anwendungsprogramm, das im Prinzip von jedermann benutzbar ist, der sich für die maschinelle Analyse literarischer Texte interessiert und gängige Kenntnisse im Umgang mit Computern hat. Nachdem das Programm zunächst als ausschließlich PC-basierte Anwendung konzipiert worden war, steht es seit 2008 in einer mit modernen Web-Technologien erstellten Fassung im Internet und wird auch nur noch dort weiterentwickelt.

Allgemeine Voraussetzungen

Das Programm di-lemmata ist eine browserbasierte textanalytische Software, die für jeden kostenlos zugänglich ist. Eine Registrierung ist dabei nicht nötig. Die Benutzeroberfläche ist komplett in der Programmiersprache JavaScript geschrie-ben, die auf qooxdoo basiert, einem innovativen Entwicklungssystem für browserge-stützte Internet-Anwendungen. Zur Nutzung des Programms muss die Funktionalität des JavaScripts im Browser aktiviert sein.

Da das Programm webbasiert ist, muss der Browser gewissen Mindestanforderungen erfüllen. Um reibungslos mit der Software arbeiten zu können, werde folgende Browser-Versionen empfohlen:

  • Mozilla Firefox ab Version 1.5
  • Microsoft Internet Explorer ab Version 7
  • Opera ab Version 9
  • Apple Safari ab Version 3

Da die Bibliothek auf umfangreiche Datenbestände zugreift, die bei Bedarf über das Internet in den genutzten Browser geladen werden, wird ein DSL- oder eine andere schnelle Datenleitung im Netzt benötigt. Mit einen ISDN- oder analogen Anschluss kann eine problemlose Nutzung nicht garantiert werden.

Eine Funktion zur Daten- bzw. Ergebnisspeicherung ist im Programm nicht enthalten und muss durch eigene Möglichkeiten (z.B. mittels Screenshot) erfolgen. Möglich ist nur, einen ausgewählten Text als PDF herunterzuladen.


Detaillierte Beschreibung des Tools

Das Tool di-lemmata beinhaltet linguistisch erschlossene Texte, wodurch der gesam-te Wortschatz dem Benutzer in der Bibliothek über lemmatisierte Wortlisten zur Ver-fügung steht. Auf dieser Grundlage lassen sich vielfältige Untersuchungsansätze bei der Arbeit mit literarischen Werken realisieren, wobei ein breites Spektrum an Sor-tier- und Filter-Optionen zu Unterstützung bereit steht.

Das Programm besteht aus folgenden vier Grundpfeilern:

  • Die Bibliothek (die Textkorpora)
  • Die Wortlisten
  • Vergleiche
  • Konkordanzen

Die Bibliothek

Die Bibliothek besteht aus insgesamt 8363 neuhochdeutschen Texten gegliedert in Unterordnern und Ordnern zu 19 Autoren. Ein direkter Link führt zu einer Biographie des ausgewählten Autors. Sobald ein Text ausgewählt wird, erscheint dieser in einem dafür vorgesehenem Fenster. Siehe Abb. 1: Die Bibliothek: