TextGrid

Aus Literatur Rechnen - Neue Wege der Textanalyse
Wechseln zu: Navigation, Suche
Unser LitRe-Wiki ist seit 2012 nicht eingreifend überarbeitet worden. Es bildet also den damaligen Stand ab. Um Weiterentwicklungen der digitalen Textanalyse abzubilden, sollen nun die Artikel peu à peu überarbeitet werden, und weitere Artikel hinzukommen.

Interesse? Haben Sie Lust, einen Artikel zu überarbeiten oder neu zu verfassen? Schreiben Sie uns! Auch Kommentare, Kritik oder Fragen sind willkommen: mailto:bherrma1@gwdg.de

TextGrid (aus dem Englischen für „das Text-Gitter“ oder auch „Text-Raster“) ist eine für die Arbeit mit Ressourcen optimierte virtuelle Forschungsumgebung für die Geisteswissenschaften, die den gesamten Forschungsprozess bis hin zur Publikation abbildet. Das Angebot besteht im Kern aus den beiden Werkzeugen TextGrid-Lab, einer flexibel einsetzbaren Anwendung für die individuelle und kollaborative Arbeit an Textressourcen, und dem TextGrid-Repository, das als Quellenbasis sowie als Austausch- und Publikationsplattform dient.

  • Das TextGridRep ist das Repository, eine digitale Bibliothek und ein geisteswissenschaftliches Langzeitarchiv.
  • Das TextGridLab ist das Laboratory, der Einstiegspunkt in die Virtuelle Forschungsumgebung mit zahlreichen Werkzeugen und Services, wie z.B. dem kostenfreien Download des "Lab"-Programms, der kostenlosen Suche und dem ebenfalls freien Wörterbuch.

Ein weiterer wichtiger Punkt ist die Community der Menschen, die in TextGrid arbeiten. Mit Hilfe der von TextGrid entwickelten Software können Geisteswissenschaftlerinnen und -wissenschaftler sowohl individuell als auch gemeinsam an textbasierten Forschungsdaten arbeiten.

Allgemeine Voraussetzungen

  • Software-Download von TextGridLab - kostenlose Nutzung von TextGrid, Open Source für Geisteswissenschaften.
  • Kostenlose Registrierung und Freischaltung erforderlich (ggf. Angabe der Forschungseinrichtung notwendig).
  • Internetzugang für Austausch in der Community.
  • Über USB-Stick auch Zugriff auf TextGridLab möglich.
  • Smartphone/Tablet (Android) möglich.
  • TextGridLab ist als aktuelle stabile Version verfügbar: TextGridLab 3.3.
  • Unterstützte Betriebssysteme: Linux, Mac OS X, Windows.
  • Aktuelle Java-Version erforderlich - derzeit Java 8.
  • Browserbasierter, registrierungsfreier Zugang und Zugriff auf TextGridRep.
  • Nutzbar mit den Browsern Internetexplorer, Opera, Mozilla, Firefox, GoogleChrome, Safari.
  • Die Digitale Bibliothek von TextGrid ist öffentlich zugänglich und kann als Print- und Web-PDF kostenlos heruntergeladen werden.
  • Daten und Ergebnisse aus dem TextGridRep können exportiert und auf lokalen oder externen Festplatten gespeichert werden.
  • Daten und Ergebnisse aus dem TextGridLab können lokal, extern und online gespeichert sowie exportiert und importiert werden.
  • verfügbar in Deutsch und Englisch.

Beschreibung

TextGrid ist eine nachhaltige virtuelle Forschungsumgebung, die seit 2006 entwickelt wurde. Ziel ist es, den Zugang zu und den Austausch von Informationen in den Geisteswissenschaften zu ermöglichen. Das Verbundprojekt mit zehn institutionellen und universitären Partnern wurde von Juni 2009 bis Mai 2015 vom Bundesministerium für Bildung und Forschung (BMBF) gefördert. TextGrid ist ein Projekt der D-Grid GmbH und Teil von WissGrid. Seit 2016 ist TextGrid Teil der Forschungsinfrastruktur DARIAH-DE. Die Nutzer von TextGrid haben die Möglichkeit, mit Entwicklern und anderen Beteiligten in Kontakt zu kommen. Hierfür werden offene Mailinglisten angeboten. Darüber hinaus finden regelmäßig Nutzertreffen statt und es werden Schulungen und Workshops angeboten.

TextGridLab und TextGridRep

Mit Hilfe der von TextGrid entwickelten Software können Geisteswissenschaftlerinnen und Geisteswissenschaftler allein oder in Kooperation mit anderen an textbasierten Forschungsdaten arbeiten. Dafür steht eine Infrastruktur zur Verfügung, die im Kern aus zwei Komponenten besteht:

TextGridLab : das TextGrid-Laboratory, das als Einstiegspunkt in die Virtuelle Forschungsumgebung zu verstehen ist und über eine intuitiv zu bedienende Software den Zugang zu den Werkzeugen und Diensten der Virtuellen Forschungsumgebung ermöglicht:
   "* Einstiegspunkt in die virtuelle Forschungsumgebung
   * Optimiert für die XML-/TEI-Erschließung z.B. im Rahmen digitaler Editionen
   * Werkzeuge und Services in einer anpass- und erweiterbaren Software
   * Einfache Integration weiterer Open Source-Tools über den "Market Place"
   * Differenziertes Zugriffs-Rechtemanagement innerhalb der geschützten Forschungsumgebung,"
     [Quelle: https://textgrid.de/web/guest/textgrid-tools-und-services, 20.03.2014]
TextGridRep : Das TextGrid Repository ist ein geisteswissenschaftliches Langzeitarchiv in einer Grid-Infrastruktur, mit dem die langfristige Verfügbarkeit und Zugänglichkeit von Forschungsdaten gewährleistet wird.
   "* Digitales Langzeitarchiv für die Geisteswissenschaften
   * Garantiert die langfristige Verfügbarkeit und Zugänglichkeit Ihrer Forschungsdaten
   * Umfangreiche Suchmöglichkeiten, verschiedene Download-Formate und Visualisierungstools
   * Lektüre, Suchabfrage, Download und Nachnutzung XML-erschlossener Text-Corpora wie z.B. der 
     Digitalen Bibliothek bei TextGrid"
    [Quelle: https://textgrid.de/web/guest/textgrid-tools-und-services, 20.03.2014]

Des weiteren verfügt die Forschungsumgebung folgende Tools:

Allgemeine Editoren und Werkzeuge

  • XML-Editor

XML-Dateien können lokal oder im Grid mit einem einfach zu bedienenden XML-Editor bearbeitet werden. Zwischen einer eher technisch orientierten Ansicht, die alle Tags und Attribute anzeigt, und einer Ansicht, die sich eher an der Darstellung eines Textverarbeitungsprogramms orientiert, können die AnwenderInnen beliebig wechseln. Über eine Unicode-Zeichentabelle wird das einfache Suchen, Kopieren und Einfügen beliebiger Symbole aus dem Unicode-Zeichensatz ermöglicht.

  • Text-Bild-Link-Editor

Der XML-Editor wird bei der Alignierung von Text- und Bildelementen durch einen Text-Bild-Link-Editor unterstützt. Das Ziel ist, eine Ausgabedatei zu erstellen, die die Textelemente enthält und die topographische Beschreibung enthält.

  • Wörterbuch-Recherche-Tool

Innerhalb der virtuellen Forschungsumgebung von TextGrid ermöglicht ein Wörterbuch-Recherche-Tool die Suche in einer Vielzahl unterschiedlicher Wörterbücher. Zu diesem Zweck wurde das Trierer Wörterbuch-Netzwerk in das TextGridLab integriert.

  • Bildbetrachtungs- und Referenzierungstool DigiLib

DigiLib ist ein Bildbetrachtungs- und Referenzwerkzeug, das die Anzeige mehrerer Bilder in einer Galerie, Zoom, Skalieren, Markieren und Referenzieren ermöglicht. Die Komponente zur Anzeige von Bildern u.a. nach eigenen Parametern sowie die Zoomfunktion (über das Kontextmenü) sind seit der Beta 2011-12 integriert.

  • Noten-Editor MEISE

Mit dem MEISE-Noteneditor können Notentexte in MEI grafisch kodiert, bearbeitet und auf einfachem Niveau auch dargestellt werden. Dadurch wird unter anderem die Visualisierung von Varianten erheblich erleichtert.

Allgemeine Dienste und Features

  • Nutzer- und Projektverwaltung

Eine mächtige Benutzer- und Projektverwaltung (Datei- und Rechtemanagement) ermöglicht es ProjektleiterInnen, neue Projekte anzulegen und weitere BenutzerInnen (in bestimmten Rollen) einem Projekt zuzuordnen. Darüber hinaus können Rechte an TextGrid-Objekten abgefragt und gesetzt werden.

  • Projektbrowser/Navigator

Ein ständiger Begleiter im TextGridLab ist der Projektbrowser/Navigator. Mit ihm wird den NutzerInnen ein einfacher Zugriff auf die für sie freigegebenen Projektmaterialien sowie deren übersichtliche Verwaltung ermöglicht. Damit stellt der Navigator für die NutzerInnen im TextGridLab einen möglichen Startpunkt dar.

  • Recherche-Tool

Ein Recherche-Tool ermöglicht die Suche über Struktur-, Meta- und Volltexte sowohl in den eigenen Projekten als auch in den öffentlich zugänglichen Daten von TextGrid. Möglich ist auch eine semantische (RDF-basierte) Suche.

  • Metadaten-Editor

Mit Hilfe eines Metadaten-Editors können die Metadaten zu den Objekten in TextGrid erstellt und verwaltet werden. Für die projektübergreifende Suche in TextGrid werden diese Metadaten verwendet. Das Metadaten-Eingabeformular kann leicht an individuelle Bedürfnisse angepasst werden.

  • Aggregation Composers

Mit Hilfe des Aggregation Composers, der einfach per Drag&Drop zu bedienen ist, können die für ein bestimmtes Thema oder Forschungsinteresse relevanten Objekte ausgewählt und gruppiert werden. Die so zusammengestellten Objekte erscheinen im Navigator als Aggregation. Diese kann bei Bedarf bearbeitet, erweitert und auch wieder aufgelöst werden - ohne die darin enthaltenen Objekte zu löschen.

  • Import/Export-Tool

Ein Import-/Export-Werkzeug bietet die Möglichkeit, lokale Daten in das Repository zu importieren und zu exportieren und stellt eine einfach zu bedienende Eingabemaske für Metadaten zur Verfügung.

  • Revisionen

Zwischenstände zur Identifizierung von Änderungen können mit Hilfe von Revisionen dokumentiert werden.

  • Publizieren (im Repository)

Unterstützt wird die Publizierung (im Repository) durch eine automatische Validierung der Metadaten.

Vorherige stabile Version 1.0 des TextGridLab

Die für diesen Artikel genutzte stabile Version 1.0 enthält drei konkrete Tools und zahlreiche Komponenten der Infrastruktur (bei denen es sich z.T. auch um Tools handelt), die der Natur des Forschungsverbundes entspringen und in der Selbstpräsentation durch TextGrid wie folgt in der Galerie beschrieben werden.

Das Interface für die Nutzung dieser Tools und Komponenten ist vergleichbar mit dem Screenshot des Recherche-Tools (s.o.). Ebenen lassen sie sich per maximieren oder minimieren in Windowsmanier anpassen.

Beta-Version von TextGridLab

Die Beta-Version enthält alle Tools und Komponenten der Version 1.0 und einige zusätzliche Features, die aufgrund der Auseinandersetzung mit der Version 1.0 an dieser Stelle noch nicht näher erläutert werden können. Auch im Benutzerhandbuch sind bis zur endgültigen Veröffentlichung der Beta-Version leider noch keine weiteren Details vorgesehen.

TextGrid Community

Bis jetzt gab es eine stetig anwachsende Community. Auf der einen Seite gibt es ein etabliertes Forum, z.B. regelmäßig stattfindenden Nutzertreffen, zu spezifischen Themen und Anwendungen, in Schulungen und Workshops anhand der TextGrid-Community. Über „Veranstaltungen“ findet man die aktuellen Veranstaltungen oder auch Dokumente. Auf der anderen Seite findet man dort auch "Forschungsverbünde und Editionsvorhaben, die TextGrid für ihre Arbeit nutzen: Projekte wie die Hybrid-Edition von Theodor Fontanes Notizbüchern (Fontane-Arbeitsstelle der Universität Göttingen), die Textdatenbank und Wörterbuch des klassischen Maya (Universität Bonn) und die Bibliothek der Neologie (Universität Münster). In der Rubrik „Projekte stellen sich vor“ präsentieren diese mit TextGrid arbeitenden Forschungsvorhaben ihre Arbeitsinhalte." Über anfragen@textgrid.de ist die Community zu erreichen: „Mitmachen: Eigene Vorhaben vorstellen Sie arbeiten selbst mit TextGrid? Stellen Sie Ihr Forschungsvorhaben hier vor! Bitte schreiben Sie an anfragen@textgrid.de, schicken Sie gerne Image-Dateien (Logos, Screenshots) mit.“ (Quelle: https://textgrid.de/de/web/guest/kooperationsprojekte 12.03.2019)

Der TextGrid Verbund

Der Forschungsverbund besteht aus folgenden Partnern:

Berlin-Brandenburgische Akademie der Wissenschaften (BBAW
DAASI International GmbH
Fachhochschule Worms
Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen (GWDG)
Institut für Deutsche Sprache (IDS)
Max-Planck-Institut für Wissenschaftsgeschichte (MPI WG)
Niedersächsische Staats- und Universitätsbibliothek Göttingen (SUB)
Technische Universität Berlin
Technische Universität Darmstadt Institut für Sprach- und Literaturwissenschaft
Julius-Maximilians-Universität Würzburg Institut für Deutsche Philologie

Phasen, Struktur und Exemplarische Darstellung von TextGrid

Abb. 6: TextGrid Avatar

TextGrid ist in erster Linie eine vernetzte Forschungsumgebung in den eHumanities, die eScience-Methoden für die Geisteswissenschaften anbietet. Ziel von TextGrid ist es, den Zugang zu und den Austausch von Informationen in den Geisteswissenschaften mit Hilfe moderner Informationstechnologien zu unterstützen. Zielgruppen sind WissenschaftlerInnen, die beispielsweise digitale Editionen erstellen, EntwicklerInnen, die Tools und Services für ihre Projekte anpassen oder externe Services und Tools in TextGrid integrieren, sowie Forschungsprojekte und Forschungseinrichtungen, die Daten in TextGrid archivieren und zur Verfügung stellen.

„Die dahinterstehende Vision eines digitalen Ökosystems basiert auf der Fortentwicklung des Open-Source-Gedankens und soll einen freien Austausch von einzelnen Komponenten und spezifische Anpassungen je nach den Bedürfnissen der Fachcommunities ermöglichen. Heute nutzen neben WissenschaftlerInnen aus der Editionsphilologie und der Linguistik auch die Altamerikanistik, die Kunst- und Kirchengeschichte, die Klassische Philologie und die Musikwissenschaft TextGrid als Virtuelle Forschungsumgebung.“

(Quelle: https://textgrid.de/web/guest/projekt, 29.12.2023)

Der nebenstehende Avatar zeigt die beiden großen Tools und verbindet sie symbolisch, wie in der Realität der Forschungsumgebung durch die Technik dahinter. TextGrid als Ganzes ist eine internetbasierte Plattform,

"die Wissenschaftlern Werkzeuge und Dienste für die Auswertung von textbasierten Daten in unterschiedlichen digitalen Archiven bietet – unabhängig von Datenform, Softwareausstattung oder Standort. TextGrid entwickelt eine Virtuelle Forschungsumgebung für Philologen, Linguisten, Musikwissenschaftler und Kunsthistoriker." (Quelle: http://www.textgrid.de, 24.02.2012)

Es sind drei Phasen von der Entstehung und Weiterführung elementar:

I.   Phase 2006-2009 umfasste nur Sprach- und Literaturwissenschaftler als Zielgruppe 
II.  Phase 2009-2012 umfasste nebst Sprach- und Literaturwissenschaft auch Musikwissenschaftler 
     und Kunsthistoriker
III. Phase 2012-2015 umfasste als Zielgruppe: Editionsphilologie, Linguistik, 
     Altamerikanistik, Kunst- und Kirchengeschichte, Klassische Philologie und 
     die Musikwissenschaft. 

Der Schwerpunkt, bei der dritten Phase, war jedoch "die Etablierung eines nachhaltigen Dauerbetriebs: Software, Archiv und damit das gesamte Angebot werden in Zusammenarbeit mit AnwenderInnen, FachwissenschaftlerInnen und Fachgesellschaften und in Kooperation mit DARIAH-DE - Digital Research Infrastructure for the Arts and Humanities auf eine nachhaltige und langfristige Basis gestellt." (Quelle: https://textgrid.de/projekt, 26.01.2020)

Jetzt, in der neuen Phase, versteht sich TextGrid wie folgt: „Zielgruppen

  • FachwissenschaftlerInnen, die mit TextGrid Forschungsprojekte wie z.B. digitale Editionen erarbeiten
  • EntwicklerInnen, die TextGrid-Tools und Services für eigene Vorhaben anpassen oder externe Services und Tools in TextGrid integrieren
  • Forschungsprojekte und -institutionen, die Daten in TextGrid archivieren und zugänglich machen (Repository).“ (Quelle: https://textgrid.de/projekt, 26.01.2020)

Der Open-Source-Gedanke führt zu einem "digitalen Ökosystem" und dient dem freien Austausch „von einzelnen Komponenten und spezifische Anpassungen je nach den Bedürfnissen der Fachcommunities“. (Quelle: https://textgrid.de/projekt, 26.01.2020).

Die Struktur von TextGrid

Da TextGrid sowohl als Sammlung von Werkzeugen zu verstehen ist, als auch die darin enthaltenen Tools umfasst, werden in den folgenden drei Grafiken die Zusammenhänge und Funktionsweisen sowie die Zielgruppen entsprechend dem Selbstverständnis von TextGrid dargestellt:

Die Startwebseite führt die drei wichtigen Punkte an: Laboratory, Repository und Community, mit dem Downloadlink für das Lab, Zugang zur Digitalen Bibliothek und Materialankündigung mit z.B. XML/TEI-kodierte Texte.

1Test.png

Abb. 10: Startseite von TextGrid


Die Tools "Wörterbuch" und "Suche" im heruntergeladenen TextGridLab sowie das gesamte TextGridRep sind ohne Registrierung nutzbar und kostenfrei:

Exemplarische Darstellung einiger Funktion des Tools TextGridLab

Um einen Eindruck von Lab zu bekommen, werden nun zwei Tools exemplarisch kurz vorgestellt. Das erste ist das Wörterbuch-Tool. Gesucht wird „Faust“ von Johann Wolfgang von Goethe.

Taucht man tiefer ein, z.B. mit der Erkenntnis, dass ein Projekt über Tucholskys Auseinandersetzung mit dem Recht in Goethes Faust existiert, lässt sich ein tiefere, zweite exemplarischer Blick auf einige Funktionen von TextGridLab werfen. Wie in der unten stehenden Galerie erkennbar, unterscheidet sich die Benutzeroberfläche von dem Tool Rep zu Lab bereits, wie im Anschluss sichtbar. In der vorliegenden 1.0 Version sind nach aktuellem Stand nur wenige automatische Verfahren verfügbar (Lemmatisierung nur in der Beta-Version), der XML-Editor sei jedoch als teil-automatisches Tool erwähnt. Die meisten Funktionen im Lab sind somit händisch vorzunehmen, da sie Projektdaten auf- und vorbereiten. Beispielsweise die Import/Export Funktion und die Annotierungsmöglichkeiten mit beispielsweise dem Text-Bild-Link Editor, der semi-händisch ist. Somit sind die Ausgabedaten je nach verwendetem Tool unterschiedlich (*.xml, *.txt, *.jpg etc.). Visualisierungen sind in der Beta-Version möglich. In der folgenden Galerie wird der Umgang mit dem Ergebnis der Recherche aus dem Rep exemplarisch gezeigt.

Eine andere Datei, z.B. eine *.jpg Datei hätte ermöglicht, den Text-Bild-Editor zu öffnen und z.B. bei einer Handschrift einen Teil des Bildes mit einem Begriff aus einem Wörterbuch anhand des Wörtbuch-Tools zu verbinden. Weitere Funktionen sind im TextGrid Manual detailliert beschrieben.

Exemplarische Darstellung einiger Funktion des Tools TextGridRep

Generell kann wie folgt, für das Rep festgehalten werden, wenn man sich nur auf der Rep-Oberfläche bewegt: "Im TextGrid-Repository-Portal finden Sie derzeit eine begrenzte Auswahl von Texten des Literaturordners der Digitalen Bibliothek sowie zukünftig Forschungsdaten die mit TextGrid erarbeitet und publiziert wurden. Weitere Inhalte der Digitalen Bibliothek werden hier ab ca. Mitte Oktober bereitgestellt." (Quelle: www.textfrid.de, 20.05.2012). Sortiert sind die Texte nach der Anzahl ihrer vorhandenen Items (quantitativ), nicht etwa alphabetisch z.Z. noch. Man erreicht die Korporaübersicht über die Suchmaske auf dem Interface, über den Button Repository Content. Ein Abruf der Metadaten ist zu jedem Item möglich. Die folgende Galerie zeigt Schritt für Schritt den Ablauf, wenn man einen Überblick über das Vorkommen von Schlagwörtern im vorhandenen Korpus (im Repository Content nach Iteam-Anzahl pro Autor zugeordnet: z.B. Tucholsky, Kurt (3595 items)) erlangen möchte, damit ist die quantitative, automatische Arbeit an dieser Stelle abgeschlossen. Das Korpus selbst besteht aus qualitativ, teilweise automatisch generierten XML-Dateien, in einer angenehmen Benutzeroberfläche. Über das Lab kann das Korpus qualitativ erweitert werden. Somit handelt es sich bei TextGrid je nach Tool und Erkenntnisinteresse um eine Mischform aus qualitativer und quantitativer Analyse.

Das Korpus der gegenwärtig öffentlich, ohne Registrierung einsehbaren Texte umfasst momentan (24.02.2012) Werke von folgenden Autoren, sortiert nach der Anzahl der vorhandenen Dokumente zu, von oder über den angegebenen Autoren:

   Tucholsky, Kurt (3595 items)
   Grillparzer, Franz (3406 items)
   Goethe, Johann Wolfgang (2232 items)
   Arnim, Ludwig Achim von (2108 items)
   Grimm, Jacob und Wilhelm (1994 items)
   Eichendorff, Joseph von (1068 items)
   Brentano, Clemens (685 items)
   Chamisso, Adelbert von (642 items)
   Fontane, Theodor (636 items)
   Droste-Hülshoff, Annette von (498 items)
   Gellert, Christian Fürchtegott (422 items)
   Kleist, Heinrich von (352 items)
   Bürger, Gottfried August (334 items)
   Gottsched, Johann Christoph (234 items)
   Hoffmann, E. T. A. (163 items)
   Fischart, Johann (151 items)
   Kafka, Franz (141 items)
   Börne, Ludwig (113 items)
   Novalis (70 items)
   Lichtenberg, Georg Christoph (51 items)
   Ebner-Eschenbach, Marie von (51 items)
   Immermann, Karl (49 items)
   Raabe, Wilhelm (38 items)
   Forster, Georg (38 items)
   Jean Paul (36 items)
   Arnim, Bettina von (30 items)
   Moritz, Karl Philipp (30 items)
   Klinger, Friedrich Maximilian (30 items)
   Nestroy, Johann (30 items)
   Schnabel, Johann Gottfried (28 items)
   Lewald, Fanny (23 items)
   Kotzebue, August von (23 items)
   Raimund, Ferdinand (23 items)
   Gotthelf, Jeremias (22 items)
   Wickram, Georg (21 items)
   Freytag, Gustav (21 items)
   Büchner, Georg (19 items)
   Keyserling, Eduard von (18 items)
   Iffland, August Wilhelm (18 items)
   Spielhagen, Friedrich (17 items)
   Ludwig, Otto (16 items)
   Heinrich Julius Herzog von Braunschweig-Lüneburg (16 items)
   Reuter, Christian (14 items)
   Grimmelshausen, Hans Jakob Christoffel von (14 items)
   Schlaf, Johannes (14 items)
   Jung-Stilling, Johann Heinrich (13 items)
   Gottsched, Luise Adelgunde Victorie (13 items)
   Wagner, Heinrich Leopold (13 items)
   Klingemann, August (12 items)
   Spyri, Johanna (11 items)
   Wackenroder, Wilhelm Heinrich (11 items)
   Nicolai, Friedrich (10 items)
   Müller, Robert (10 items)
   Schlegel, Dorothea (9 items)
   Loën, Johann Michael von (7 items)
   Ziegler und Kliphausen, Heinrich Anselm von (7 items)

Daten-Einspeisung

Web-Storage-Charakter?

Generell kommt es bei TextGrid auf das spezifische Erkenntnisinteresse und den Bearbeitungswunsch an, wenn die Frage der möglichen Daten-Einspeisung näher beleuchtet werden soll. Da die Möglichkeit besteht, Projekte und in TextGridLab annotierte (oder vorher annotierte) Texte online zu speichern, so dass man von jedem beliebigen Rechner per USB Stick nach dem Login auf diese Daten zugreifen kann, sie importieren und exportieren kann, ist zunächst nahezu jedes Format einspeisbar, so dass ein Projektpartner sich dieses exportieren kann und anderweitig bearbeiten kann. Somit hat TextGrid gewissermaßen einen Web-Storage-Charakter, mit der Transparenz einer gewissen Chronik. Inwiefern die Dokumente im Anschluss nach dem "Zwischenspeichern" noch nutzbar sind, außerhalb von TextGrid, und ob es somit wirklich als eine Art Web-Storage betrachtet werden kann, steht somit noch in Frage. Im Unterschied zu anderen Tools lassen sich Dateien des "falschen" Formats zumindest importieren, und das Lab such nach einem Editor, den es jedoch bei folgenden Dateitypen gegenwärtig (Stand: 24.02.2012) nicht findet: *.rar, *.zip, *.pdf, *.doc, *.docx, *.odt, *.ppt, *.mp3, *.avi.

Unterstütze Formate

Problemfrei zu importieren und zu nutzen sind z.B. Dateien des Typs: *.txt, *.rtf, *.xml, *.jpg, *.png. Auch bereits in TextGridLab erstellte *.xml TEI-Metadaten (TEI = Text Encoding Initiative) oder aus dem Rep exportierte Dateien sind einspeisbar und nutzbar. Eine Dateigrößenbeschränkung trat bisher nicht auf (Versuch bis 6MB Einzeldatei). Das Import-Tool des Labs ermöglicht per einfachem Drag&Drop das Zusammenstellen eigener Korpora innerhalb eines Projekts und erlaubt dabei explizit die Mischung verschiedener Dateitypen (z.B. *.png und *.txt), die diese, anders als bei bisherigen Tools, Text und Bild verknüpfen können. Jedoch können auch Einzeltexte hochgeladen werden. Vor-annotierte Texte sind möglich, da es sich um einen Forschungsverbund handelt, liegt die Annotation im jeweiligen Interesse der Forschungsgruppe und kann z.Z. noch nicht ausreichend beantwortet werden. Ein *.xml Annotierung ist nützlich, kann aber auch im Lab vorgenommen werden. Die Urheberrechtsfrage ist bei den Texten, die im Rep verfügbar sind und transparent gemacht werden. Wünschenswert und möglich ist dies im Meta-Daten-Editor im Lab.

Benutzerfreundlichkeit

Allgemeine Nutzerfreundlichkeit

Die Fülle an Möglichkeiten kann den ungeübten Benutzer im ersten Moment überfordern, aber nach wenigen Minuten ist ein intuitives Bedienen von TextGrid sehr pragmatisch. Das Rep verfügt über eine benutzerfreundliche, optisch ansprechende Oberfläche. Gleiches gilt für das Lab, das durch die Ikone und Symbole auf den Buttons sehr intuitiv und benutzerfreundlich ist. Selbiges kann auch für die übersichtliche, sehr informative Homepage festgehalten werden, die auch über ein knappes F.A.Q. verfügt, dass aber sehr gut bei Fragen weiterhilft. Da es sich bei TextGrid um mehr als ein Tool, nämlich um eine Forschungsumgebung handelt, die als Zielgruppe Geisteswissenschaftlerlnnen bei Austausch und Forschung eine Unterstützung ist, steht Benutzerfreundlichkeit an erster Stelle. Dies ermöglicht auch Einsteigern nach einer kurzen Einarbeitungsphase, eine Nutzbarmachung, je nach Erkenntnisinteresse. Das Wörterbuch-Tool beispielsweise, ist ebenfalls extrem intuitiv und durch seine Verknüpfungen, interdisziplinär auch für Einsteiger sofort nutzbar.

Glossar

Neben einem knappen Eintrag auf der deutschen Wikipedia und der englischsprachigen Wikipedia, gibt das jedoch nur in englisch vorhandene, digitale (oder bei der SUB Göttingen gedruckt erfragbare) Benutzerhandbuch Hilfestellung. Da das TextGridLab selbst in englischer Sprache auftritt, ist ein Manual nur in englisch jedoch nicht störend. Vor allem im Hinblick auf den internationalen Austausch den TextGrid anstrebt, bietet sich diese Vereinheitlichung an. Korpora, Texte und Projekte sind jedoch auch problemfrei in deutsch eingespeist und einspeisbar.

Problembehandlung

Bei Fragen steht neben dem ausführlichen "Help"-Button im Lab außerdem das Team von TextGrid gerne per E-Mail zur Verfügung, oder die Nutzertreffen können Aufschluss geben und die Vernetzung ist sehr hilfreich. Das Team freut sich über Verbesserungsvorschläge und Erweiterungsideen ausdrücklich. Ein ausführliches Demo-Video (auch zum freien Download in hoher Qualität auf der Webseite verfügbar, Windows Media Player nötig) gibt erste Einblicke in die essentiellen Lab Tools. Bei der Nutzung der Editoren, vor allem des XML-Editors, sind basale Programmierkenntnisse von Vorteil, aber nicht zwingend nötig, da das Handbuch und das Demo-Video weiterhelfen. Auch einige YouTube-Videos, die exemplarisch Funktionen von TextGrid zeigen, sind verfügbar. Besonders spannend sind hierbei Vergleiche zwischen älteren, einige Jahre zurück liegenden, und jüngeren Videos, welche die Weiterentwicklung von TextGrid veranschaulichen. Ein fast drei stündige Einführung mit dem Titel „TextGrid-Webinar: Eine Einführung“ gibt es zudem. (Quelle: https://youtu.be/RIq2NZcapA4, 20.08.2021)

Kommunikation von und über TextGrid

Der Verein TextGrid e.V. dient der "persistenten Sicherstellung des fachwissenschaftlich nachhaltigen Gebrauchs der Angebote der TextGrid-VFU in einer heterogenen Community wissenschaftlicher Nutzerinnen und Nutzer." (Quelle: http://www.textgrid-verein.de/index.html Herbst 2020). Der TextGrid e.V. unterstützt die inhaltliche Arbeit, durch Kommunikation von Mehrwert und Nutzen von TextGrid in der Wissenschaft. Des weiteren findet man auf der Homepage die stetig wachsende, aktive Community, mit immer neuen Projekten und Veranstaltungen, z.B. auf Twitter

Transparenz

Als wissenschaftliche Forschungsumgebung verfügt TextGrid wie wenig andere Tools über eine derartig enorme Transparenz, weit mehr als zum Beispiel Di-Lemmata, aber ähnlich wie Ant-Conc. Es seien als Beispiele erneut das „Langzeitarchiv“ oder „Publikationen“ als Stichworte genannt. Das "Innenleben" der Tools und der gesamten Forschungsumgebung sind detailliert einsehbar und jeder Schritt der Weiterentwicklung, Fehlermeldung und Veränderungen nachvollziehbar.

Abb. 24: Transparenz des Innenlebens von TextGrid
Abb. 25: Feedback-Formular auf der Entwicklerseite http://www.textgrid.de
Abb. 26: Transparenz der im Archiv und für Arbeit nutzbaren Textedition sowie Downloadmöglichkeit der Meta-Daten im TEI-Format
Abb. 27: Transparenz bei Lizenzen im Rep

Anhand des Vorgangsnavigators lässt sich außerdem jeder einzelne Vorgang der Veränderung nachvollziehen, noch ausstehende Veränderungen oder den Status der Bearbeitung von Updates nachvollziehen. Insbesondere sorgt die Angabe des Namens des Bearbeiters für Transparenz.

Die Entwickler weisen auf ihrer Webseite auf bekannte Probleme wie mit der jüngsten Ubuntu-Version, Windows XP Darstellung bei der Beta-Version oder benötigte aktuelle Javaversion hin. Außerdem verweisen sie auf alle ihnen bekannten Fehler anhand des Ticket-Systems JIRA und bieten Hilfeleistung per E-Mail support(at)textgrid.de.

Auch das explizit Angelegte Feedbackformular lädt ein, an dem Projekt aktiv mitzuarbeiten und es stetig zu verbessern. Die aktuelle Version TextGrid 1.0 wird als stabil beschrieben, die Beta-Version enthält deutlich mehr Tools, wird aber auch explizit als instabil betrachtet. TextGrid basiert auf der Open Source Community Software ECLIPSE.

Federführend für die Transparenz ist die Möglichkeit, sowohl im Lab als auch Rep Metadaten im Format TEI herunterzuladen. Neben einer absoluten Editionsklarheit, sind auch die Lizenzen im Rep gut nachvollziehbar.

Nutzerprojekte

Laut dem Eintrag der Webseite sind auch einige Nutzerprojekte vertreten. z.B. diese:

  • „Die Theodor Fontane-Arbeitsstelle der Georg-August-Universität Göttingen arbeitet an einer genetisch-kritischen und kommentierten Hybrid-Edition der Notizbücher des Schriftstellers.[...]
  • Das Editionsprojekt „Johann Friedrich Blumenbach – online“ der Akademie der Wissenschaften zu Göttingen wird die mehr als 1.000 Publikationen Johann Friedrich Blumenbachs (1752–1840) in elektronischer Form zugänglich machen und die darin erwähnten Objekte aus Blumenbachs Sammlungen identifizieren und digital zur Verfügung stellen. Das Projekt hat u. a. das Ziel, die Interdependenz von Sammlungs- und Forschungsdynamik aufzuweisen. Die Quellensituation dafür ist wegen der Kontinuität des universitären Sammelns in Göttingen besonders günstig: Vieles von dem, was Blumenbach zusammengetragen und untersucht hat, ist – wenn auch zerstreut – bis heute nachweisbar und Bestandteil unterschiedlicher Sammlungen der Universität Göttingen. Auch die Dokumente zu Herkunft und Geschichte der Objekte sind in vielen Fällen noch vorhanden. Die Onlineedition wird sowohl digitale Faksimile und TEI-codierte Versionen der Texte als auch hochauflösende Fotografien, stereoskopische Aufnahmen und 3D-Animationen der Objekte enthalten. So entsteht eine Textedition mit Bildmaterial in einem Umfang und einer Qualität, die in gedruckten Werkausgaben nicht erreichbar wären. In den Texten werden 16 formale und inhaltliche Merkmale nach TEI codiert und so für eine Auswertung mit digitalen Werkzeugen zugänglich gemacht. Zu den Objekten werden Identifikationen, Metadaten, Daten zur Provenienz und Besitzgeschichte geliefert, die auch unabhängig von den Texten nach Herkunftsgebiet, Donatoren, Zeiträumen und naturwissenschaftlichen Klassifikationen durchsuchbar sind. Sie schaffen so einen neuartigen Zugang zu Blumenbachs Gedankenwelt von der Seite der konkreten Sammlungsobjekte her. Durch den Abgleich der von Blumenbach in seinen Publikationen erwähnten Objekte mit dem – entsprechend erschlossenen – übrigen Sammlungsmaterial aus seiner Zeit wird sich auch analysieren lassen, wie Blumenbach das ihm zur Verfügung stehende Material nutzte, welche Auswahl er traf, was er wegließ, was er für auffällig hielt und was er vernachlässigte. Im Rahmen dieser Aufgaben war das Projekt "Johann Friedrich Blumenbach -online" der Akademie der Wissenschaften zu Göttingen von 2010 bis 2015 kooperativer Projektpartner (mit Personalstellen) in "TextGrid".[...]
  • Die mittelalterlichen Handschriften aus der Trierer Benediktinerabtei St. Matthias werden durch das Projekt „Virtuelles Skriptorium St. Matthias“ digitalisiert.[...]
  • Das Projekt Textdatenbank und Wörterbuch des Klassischen Maya (NRW-Akademie der Wissenschaften und Künste: Arbeitsstelle Universität Bonn) erschließt digital die epigraphischen und objektgeschichtlichen Inhalte sämtlicher Hieroglyphentexte, die zwischen dem 3. Jh. v. Chr. bis zur Ankunft der Spanier im 16. verfasst wurden. Auf Basis dieser Daten wird sowohl eine Datenbank als auch ein umfassendes Wörterbuch der klassischen Mayasprache erstellt und veröffentlicht werden.“

Es gibt natürlich noch weitere Projekte, diese dienen der Eindruckvermittelung.

Fazit

Auf ihrer Homepage nennen die Entwickler zehn Gründe, warum TextGrid unterstützenswert ist: "TextGrid umfasst Werkzeuge, Infrastrukturentwicklung und Grid-Technologien. Geistes- und Kulturwissenschaftler werden durch TextGrid in die Lage versetzt, in einer verteilten, sicheren, flexiblen und erweiterbaren Forschungsumgebung zusammenzuarbeiten und gemeinsam Werkzeuge, Daten und Methoden zu nutzen:

  • "1. Die TextGrid-Infrastruktur ermöglicht dank ihrer serviceorientierten, modularen Architektur, die auf offenen Standards basiert, einen hohen Grad an Interoperabilität.
  • 2. TextGrid stellt eine Plattform bereit, durch die nahezu alles in einer einzigen Forschungsumgebung erfassbar wird. Der komplette wissenschaftliche Arbeitsablauf soll abgedeckt werden: Vom Sammeln und Generieren von Primärdaten bis hin zu Veröffentlichungen. TextGrid ermöglicht einen freien und einfachen Zugriff auf eine stetig wachsende Anzahl von wissenschaftlichen Ressourcen.
  • 3. Die Grid-Technologie stellt Ressourcen für die Datenverarbeitung und -speicherung bereit. Damit ist es nicht mehr notwendig projektspezifische Ressourcen extern zu erwerben, zu konfigurieren oder aufrechtzuerhalten.
  • 4. TextGrid ermöglicht dezentrale gemeinschaftliche Forschungsarbeiten.
  • 5. TextGrid bietet Sicherheit und Verlässlichkeit durch eine feingliedrige Rechteverwaltung und die Speicherung der Daten im Grid. Eine ständige Verfügbarkeit und Ausfallsicherheit der gespeicherten Daten wird durch die D-Grid-Infrastruktur garantiert.
  • 6. TextGrid ist flexibel: Eigene Projekte können organisiert und Arbeitsläufe spezifisch definiert werden. Die gesamte Arbeitsumgebung kann an fachspezifische Bedürfnisse angepasst werden.
  • 7. TextGrid ist erweiterbar: Existierende Werkzeuge können erweitert und eigene hinzugefügt werden - entweder als (externer) Web-Service oder als interaktives Tool in der Eclipse-Rich-Client-Plattform.
  • 8. TextGrid basiert auf offenen Standards (Dateiformate, Schnittstellen, Protokolle, etc.) und ermöglicht damit den Austausch und die Wiederverwendung der Daten und Tools.
  • 9. TextGrid ist ein open-source-Projekt. Sämtliche Werkzeuge und viele Inhalte sind frei zugänglich und dokumentiert, so dass alle Wissenschaftler in der Entwickler-Community mitwirken können.
  • 10. TextGrid erlaubt die mittel- und langfristige Archivierung der Projektdaten (auch nach dem Ende der Projektlaufzeit im Jahre 2012), in Übereinstimmung mit den Grundsätzen zur Sicherung guter wissenschaftlicher Praxis der Deutschen Forschungsgemeinschaft." (Quelle: http://www.textgrid.de/ueber-textgrid/warum-textgrid.html, 24.02.2012)

Den 10 Gründen TextGrid zu verwenden, kann nach der Analyse und Verwendung der Tools auf ganzer Linie zugestimmt werden. In erster Linie ist TextGrid als Forschungsumgebung, und nur in zweiter Linie als Tool im Sinne des Seminars zu fassen. Daher fällt der Vergleich mit Tools wie z.B. WMatrix, CATMA, oder Voyant schwer bis gar nicht zu ziehen. Da TextGrid erweiterbar durch andere Tools ist, als die vorhandenen, würde es sich anbieten, zur reinen computergestützten Analyse von Texten Tools wie CATMA oder Voyant zu integrieren, ähnlich dem Wörterbuch-Tool, dass aus verschiedenen Wörterbüchern gespeist wird, da TextGrid als reines Analyse-Tool im Sinne von beispielsweise 'Part-Of-Speech-Tagging' oder 'Konkordanzanalysen' und beim semantischen Taggen, noch deutliche Lücken aufweist. Dies ist mit der Natur der Forschungsumgebung zu erklären. Ungeschlagen ist daher auch die wissenschaftliche Transparenz und Benutzerfreundlichkeit. Dennoch ist die Arbeit mit TextGrid nicht die Arbeit mit einem Tool, dass nach der Einspeisung per Knopfdruck ein Ergebnis bietet und grafisch präsentiert wie z.B. CATMA oder WMatrix, sondern eine spezifische Fragestellung ist nötig, ebenso wie detaillierte Vorarbeit. (Die Beta-Version bietet für Musikwissenschaftler jedoch eine potentielle grafische Darstellungsform.) Im Sinne des Seminars kann TextGrid als eine Art Aufbereitungstool verstanden werden, falls man es auf kleine Tools des Labs beschränkt. Doch bietet die Community qualitativ andere Ressourcen, da die Rückmeldung von aktiven, gegenwärtigen, natürlichen Personen als Grundidee der Forschungsumgebung ein anderes Ziel verfolgt, als andere Tools. Die Arbeit mit TextGrid ist somit mehr das Einlassen auf Austausch, entwickeln von Ideen, dokumentieren von Projekten und nicht die quantitative Forschungsmethode schlechthin. Damit wird im Vergleich zu anderen Einzel-Tools, eine andere Dimension von computergestützter Arbeit mit literarischen Texten generiert (vgl. Rommel 2004). Die Entwickler selbst sind sich der Differenz zu anderen Tools, aber auch der zukunftsweisenden für die eHumanities bewusst, indem sie postulieren:

"TextGrid ist eines der ersten Projekte, die e-Science Methoden und Grid-Technologien für die Geisteswissenschaften verfügbar machen. Dieses Gebiet birgt ein ungeheures Potenzial zur Erleichterung, Verbesserung und Intensivierung von Forschungsprozessen und muss für die Geisteswissenschaften weiter erschlossen werden. TextGrid fungiert hier als Inkubatorprojekt für Folgeaktivitäten aus den Geisteswissenschaften." (Quelle: www.textgrid.de, 24.02.2012)

Eben die Tatsache dass es sich mehr um einen Forschungsverbund, als um ein Tool handelt, führt dazu, dass der Zeitaufwand zur Vorbereitung von Projekten recht hoch ist. Die händische Bearbeitung wird durch die Tools jedoch - intuitiv - unterstützt. Die automatischen Generierungen hingegen, sind wenig zeitaufwändig, wie z.B. der Text-Image-Editor. Aufgrund der Transparenz und Dokumentation der Projekte, und der unanfechtbaren Wissenschaftlichkeit (z.B. der Wörterbücher), kann generell von Zuverlässigkeit gesprochen werden. Durch Beta-Version Tools wie z.B. Lemmatizer, verringert sich die händische Vorbereitungszeit, und bietet damit schneller Editionen die mit Text-Mining Tools bearbeitet werden können. Vor annotierte Projekte, oder exportierbare Dateien aus dem Rep oder den Wörterbüchern eignen sich bereits dafür. Quantitativ ist vor allem das Rep für oberflächenstrukturelle Fragen geeignet. Anhand der Ergebnisse des Reps ist auch hypothesengenerierendes Arbeit möglich, wenngleich exploratives Arbeiten durch die Natur des Forschungsverbundes mit vielen kleinen Tools intuitiver erscheint. Komplexere Fragestellungen erfordern eine größere händische Aufbereitung, werden jedoch durch die Tools angenehm gestützt, wie die Beispielanwendung zeigt. Bis dahin kann nur abgewartet werden, bis TextGrid seinen ‚Kinderschuhen‘ entwächst und mit der Beta-Version ein mächtiges geisteswissenschaftliches Tool liefert. TextGrid als Community eröffnet computergestützte Literaturarbeit im Sinne Rommels (2004): Weg von einer einzelnen subjektiven Meinung hin zu empirischer Objektivität durch Austausch, Tools und Transparenz.

Beispielanwendung von TextGridLab

Vorüberlegungen

Rommel (2004) konstatiert den invertierten Ausgangspunkt meiner (bereits im Vorfeld getroffenen und durch seinen Text gestützten) Überlegungen:

"even the earliest forms of oral literature were practiced in a context of descriptive and prescriptive aesthetics. With the rise of written literature emerged a canon of rules that could be applied to text in order to evaluate its adherence to poetic norms and values, and very soon quantitative and qualitative methods of text analysis were applied in textual exegesis."

Mein Erkenntnisinteresse liegt gegenwärtig auf der verschriftlichen Repräsentation von Mündlichkeit. Eine Forschungsumgebung wie TextGrid, die sich explizit nicht nur an Linguisten und Literaturwissenschaftler wendet, sondern auch andere Geistes- und Kulturwissenschaften, erschien mir als optimal geeignet, um mich mit der Repräsentation von Mündlichkeit zu beschäftigen. Im Erkenntnisinteressenschwerpunkt lag ein konkreter Text des deutschen Poetry Slam Meisters Sebastian23 mit dem Text „Identität“.

Im Folgenden werden also nun Überlegungen und Versuche beschrieben, wie TextGrid bei der Arbeit an einem nicht vor-annotierten Text unterstützen kann. Das Ziel war, eine knappe synchrone Analyse des Textes "Identität" vorzunehmen, und zu erproben, wie TextGrid dies ermöglicht oder ggf. erleichtert. Damit soll eine Basis geschaffen werden, um später z.B. einen Vergleich mit dem Text, den ich auch erst als Projekt einspeisen müsste, der mittelalterlichen Minnelyrik - beispielsweise dem Kürenberger Falkenlied - aus kultur- und literaturwissenschaftlicher Sicht, zu erstellen. Beide Texte sind konzeptionell für den mündlichen Vortrag gedacht, und eignen sich daher außerdem zum diachronen Vergleich der Repräsentation von Mündlichkeit in der Verschriftlichung. Sprechwissenschaftlich ist es zudem spannend, zu betrachten dass diese beiden mündliche Texte ohne Intonationsnotizen (zum Vortrag im Sinne der vermeintlichen Autorintention) gedruckt wurden. Kulturwissenschaftlich ist an sich die Frage spannend, warum mündlich konzipierte Texte überhaupt verschriftlicht werden (müssen), wo es doch ein Kulturelles Gedächtnis auch über die Jahrhunderte gibt. Um all diese Fragen im Ansatz beantworten zu können, werde ich nun mit einem Text als Beispiel das TextGridLab versuchen.

Untersuchungsobjekt

Text von: Sebastian 23 – Identität

Im tiefen, klaren Ozean 
schwimmt ein gestörter Pavian!
Er leugnet dreist sein Affentum
und sucht nun bei den Fischen Ruhm!
Er hat sich einfach kahlrasiert, 
ein Schuppenmuster tätowiert,
und gleitet so durch's weite Blau:
Er träumt von einer Thunfisch-Frau!
Jedoch die Fische, die trifft, 
wirken auf ihn wie bekifft!
Er gibt sich ernst, doch was er macht:
Er wird vom Fischvolk ausgelacht!
Der Grund dafür ist leicht erraten, 
er wird ihn nie los, den Primaten,
und imitiert den Hochseehecht
zwar leidenschaftlich, aber schlecht!
Frustriert kehrt er zurück an Land, 
und zahlt so seiner Gene Pfand!
Doch ziemlich schnell findet er raus:
Jetzt lacht man ihn hier auch noch aus.
Die Schuppen-Tattoos geh'n nicht ab: 
Er bleibt ein Halb-Fisch bis zum Grab!
Verloren zwischen beiden Welten,
kann für ihn ein Ziel nur gelten:
Er hebt voll zuversicht die Arme 
und fängt zu flattern an
und fliegt zur Sonne, in das Warme
als ein Vogel-Pavian!

In: Petra Anders (Hg.): Texte und Materialien für den Unterricht. Slam Poetry. Für die Sekundarstufe. Stuttgart 2008, S.35-36.

Theoretisches Vorgehen

Es folgen die grundlegende Schritte zur Nutzung von TextGridLab: Zunächst lade ich mir TextGridLab von der offiziellen Website herunter und installiere es auf meinem Computer. Ich starte, nach dem entzippen und installieren die Anwendung und richte meine Benutzerumgebung ein. Problematisch ist, dass ich eine Forschungsumgebung oder ein Institut angeben muss, sonst klappt es nicht. Über Umwege ist es mir temporär allerdings erlaubt, als Studentin teilhaben zu können. Ich erstelle zunächst ein neues Projekt in TextGridLab und definiere den Namen und den Speicherort des Projekts: „Sebastian23“. Ich importieren die Textdatei als Sebastian23Id.txt, die ich zuvor von einem Reclamheft abgetippt habe, die ich analysieren möchten, in mein Projekt. Allgemein könnte es aber auch ein literarischer Text, ein Transkript einer gesprochenen Interaktion oder ein anderer Texttyp sein. Ich erstelle per Mausklick das sehr intuitive Werkzeug: Annotationsebenen, um verschiedene Aspekte des Texts zu markieren oder zu analysieren. Dies könnten Wortebenen, Satzebenen oder thematische Ebenen sein. Ich beginne mit der Annotation meiner Textdaten, indem ich spezifische Merkmale markieren oder analysieren. Dies kann das Hervorheben von Schlüsselwörtern, das Markieren von Strukturen oder das Hinzufügen von Metadaten umfassen. TextGridLab bietet mir verschiedene Werkzeuge zur Analyse meiner annotierten Textdaten. Ich speichere mein Projekt und die Ergebnisse meiner Analysen für den Moment. Ich kann auch bestimmte Annotationen oder Analysen für weitere Verwendungszwecke exportieren. Zum Abschluss kann ich die Dokumentationen oder Berichte zu meiner Analyse und Ergebnissen direkt in TextGridLab hinterlassen und es für andere ForscherInnen des TextGrid zugänglich machen. Über anfragen@textgrid.de ist es außerdem Möglich, die Community konkret um Support zu bitten.

Exkurs

Es folgt nochmal das knappe, detaillierte Vorgehen.

Im Detail: Text-Suche und Projekt/Usermanagement

Nach den Vorüberlegungen stand zunächst im Fokus meines Interesses eine knappe semantische Analyse des poetischen Textes vorzunehmen. Da ich mich in einem Forschungsverbund bewege, wollte ich zunächst in Erfahrung bringen, ob der Text schon annotiert im Langzeitarchiv TextGridRep vorhanden ist. Die Suche war jedoch leider ergebnislos. Somit galt als nächstes, auf die Tools des TextGridLabs zurückzugreifen, und nach dem Login die Suchfunktion für alle öffentlichen Projekte, Volltexte und Metadaten zu nutzen. Die Suche nach "Sebastian23", "Poetry Slam" und "Slam" war jedoch ergebnislos. Ich hatte die Hoffnung, auf einen Forscher zu treffen, der sich zur Zeit ebenfalls mit einem ähnlichen Projekt beschäftigt. So galt es als nächstes ein neues Projekt anzulegen, die Meta-Daten mit "Poetry Slam", "Sebastian23" und "Identität" auszustatten, so dass ein anderer Forscher das Projekt finden kann.

Importieren, annotieren und Projektabschluss

Da der Text nicht vorhanden war, entnahm ich ihn der einzigen Quelle, einem Reclamheft, und importierte die Datei als Sebastian23Id.txt Datei. Hätte ich ein Foto von der Handschrift von Sebastian23, hätte ich dieses gern verwendet, um eine Annotierung mit dem Text-Image-Link Editor vorzunehmen. Somit beschloss ich mich zunächst auf die semantische Annotierung des Textes anhand des Wörterbuch-Tools zu konzentrieren. (Da ich mit der stabilen 1.0 Version, und nicht der instabilen Beta-Version arbeite, kann ich leider noch nicht auf das Tool "Lemmatizer" zurückgreifen, das es erlaubt hätte, die automatisierte Rückführung einer Wortform auf ihr Lemma vorzunehmen. "Einzelne Wörter können via Kontextmenü direkt aus dem XML-Editor lemmatisiert werden. Komplette Texte können über das Tool automatisch mit Lemmata ausgezeichnet werden." (Quelle: www.textgrid.org, 20.04.2012)). Einzelne Wörter wie "Pavian" kann ich nun also mit dem Wörterbuch-Tool herausarbeiten und direkt mit dem Wort in meiner XML-Datei verknüpfen, so dass in der finalen Ausgabeversion dann der Wörterbucheintrag abrufbar wäre. (Das selbe böte sich für den mediävistischen Text an, hier könnte man sich dann für eine diachrone Betrachtung der Texte entscheiden, indem man beide Texte beispielsweise mit dem Mittelhochdeutschen Wörterbuch, dem Grimm'schen und dem Grammatisch-Kritischen Wörterbuch verknüpft und so auf Bedeutungsunterschiede und damit naheliegende Interpretationsunterschiede schließen könnte). Mit der semantischen Annotierung nähert sich TextGrid für diese spezielle Fragestellung ohne weitere Unterstützung (anderer Forscher, Literatur, Medien) nahezu dem Ende. Die Beta-Version lässt durch Möglichkeiten wie das Noten-Editor-Tool MEISE jedoch darauf hoffen, dass es zukünftig möglich sein wird, Texte auch mit Intonationszeichen zu annotieren und beispielsweise ähnlich dem Text-Image-Editor-Tool auch *.avi und*.wav/*.mp3 Dateien nutzen und verknüpfen zu können, um auch die Sprechweise mit aufnehmen zu können. Abschließend wäre noch eine Edition anhand der IPA-Transkription möglich, die jedoch auch (nach meinem gegenwärtigen Kenntnisstand) komplett händisch eingegeben werden müsste, sich aber auch nur der Standardlautung und nicht der Sprechweise des Autors annähern würde. Bei einem mediävistischen Text wäre selbstverständlich nur eine vermeintliche Intonationsedition möglich, hier wäre der Text-Image-Editor für eine Handschrift des Falkenliedes jedoch sehr nützlich. Das Hochladen verschiedener Dateien (Text, IPA-Edition, Meta-Daten, *.avi und *.mp3, Bild der Handschrift) könnte noch mit dem Aggregations-Tool gebündelt werden. Zwischenstände könnten anhand von Revisionen dokumentiert werden, um Änderungen zu identifizieren. Nach erfolgreichem Abschluss des Projekts, könnte es im Repository publiziert und dem Langzeitarchiv verfügbar gemacht werden, dabei würde es unterstützt durch eine automatische Metadatenvalidierung.

Fazit der Anwendung

Die Forschungsumgebung TextGrid bietet deutlich nützliche Tools, v.a. das Wörterbuch-Tool in Verbindung mit dem Editor. Insbesondere das anschließend leichte publizieren, die Transparenz und die Möglichkeit, andere Forscher in ein Projekt einzubeziehen, eröffnen große Möglichkeiten. Die Unterstützung aus der Community ist hierbei der markante Dreh- und Angelpunkt um die eigene Arbeit gemeinsam weiter zu bringen. Der erste Schritt der Annotierung anhand des Wörterbuch-Tools ist jedoch sehr komfortable und bietet einen leichten, wissenschaftlich validen Zugang. Auch die im vorherigen Abschnitt beschriebenen Optionen der Bild-Text Editierung oder der Bündelung von Projektdaten, ebenso wie die Transparenz der Forschungsumgebung sind gewinnbringend. Mit dem Erscheinen einer stabilen Beta-Version eröffnen sich weitere Möglichkeiten für die Nutzung dieses sehr guten TextGrid.

Literatur

Verwendete Literatur

  • Anders, Petra (2008): Texte und Materialien für den Unterricht. Slam Poetry. Für die Sekundarstufe. Stuttgart 2008, S.35-36.
  • Rommel, Thomas (2004): Literary Studies. In: Susan Schreibman, Ray Siemens, John Unsworth (Hrsgg.): A Companion to Digital Humanities. Oxford: Blackwell, [1], 24.06.2012.
  • Poetry Slammer Sebastian23 [2]
  • TextGrid – Virtuelle Forschungsumgebung für die Geisteswissenschaften, [3], 24.02.2012
  • TextGrid Verein, [4], 28.12.2023
  • TextGrid-Webinar: Eine Einführung, [5], 10.06.2021

Weiterführende Literatur von / zu / über TextGrid

Ein Verzeichnis aller aktuellen Projekte findet sich hier: [6] (Stand: 02.09.2012).

Zum Nachlesen: TextGrid. In: Heike Neuroth, Martina Kerzel, Wolfgang Gentzsch (Hrsg.): Die D-Grid Initiative. Göttingen 2007.

Weblinks