TextGrid

Aus Literatur Rechnen - Neue Wege der Textanalyse
Wechseln zu: Navigation, Suche

ACHTUNG: Hier entsteht gerade ein Eintrag zu TextGrid unter Zuhilfenahme von Dragon Natuarally Speaking Software. Alle Inhalte sind vorläufig :-)

Trotz Vorläufigkeit ;): Ich hab bei "Literatur" nur die zitierte Literatur angegeben ... Haltet ihr's für sinnvoll, weitere Literaturtipps anzugeben? s.e.

Logo von TextGrid

Bei TextGrid handelt es sich um eine Virtuelle Forschungsumgebung, entwickelt von einem Forschungsverbund, dessen Ziel es ist, den Zugang und den Austausch von Informationen in den Geistes- und Kulturwissenschaften mit Hilfe moderner Informationstechnologie (Grid) möglich zu machen, zu unterstützen und zu fördern. Insbesondere gilt dies gegenwärtig für Editionsphilologen, Linguisten, Musikwissenschaftler und Kunsthistoriker.

"TextGrid umfasst Werkzeuge, Infrastrukturentwicklung und Grid-Technologien. Geistes- und Kulturwissenschaftler werden durch TextGrid in die Lage versetzt, in einer verteilten, sicheren, flexiblen und erweiterbaren Forschungsumgebung zusammenzuarbeiten und gemeinsam Werkzeuge, Daten und Methoden zu nutzen."
"Warum TextGrid?" - Die Entwickler nennen 10 Gründe, 24.02.2012

Dabei sind insbesondere die beiden Tools TextGridRep und TextGridLab, nebst der transparenten, aktiven Community der Forscher zu nennen:

  • Bei TextGridRep handelt es sich um das Repository, eine digitale Bibliothek und geisteswissenschaftliches Langzeitarchiv.
  • Bei TextGridLab handelt es sich um das Laboratory, den Einstiegspunkt in die Virtuelle Forschungsumgebung mit zahlreichen Werkzeugen und Services.

Das Verbundprojekt wird von Juni 2009 bis Mai 2012 vom Bundesministerium für Bildung und Forschung (BMBF) gefördert.


Kurzbeschreibung des Tools

Die Beschreibungen orientieren sich stark an der Selbstpräsentation von TextGrid.' Die Virtuelle Forschungsumgebung TextGrid ist vorrangig in zwei unterschiedliche Komponenten aufgeteilt:

TextGridLab: dem TextGrid Laboratory, zu verstehen als der Einstiegspunkt in die Virtuelle Forschungsumgebung, mit Zugriff auf Werkzeuge und Services in einer intuitiv bedienbaren Software.
TextGridRep: dem TextGrid Repository, das ein Geisteswissenschaftliches Langzeitarchiv in einer Grid-Infrastruktur darstellt, und damit eine langfristige Verfügbarkeit und Zugänglichkeit der Forschungsdaten garantiert.

Die Staats- und Universitätsbibliothek Göttingen ist gegenwärtig (Stand:Febaruar 2012) mit der Projektleitung betraut.

Der TextGrid Forschungsverbund besteht aus folgenden Partnern:

SUB Göttingen Georg-August-Universität Göttingen, Niedersächsische Staats- und Universitätsbibliothek Göttingen (Projektleitung)
DAASI DAASI International GmbH, Tübingen
FH Worms Fachhochschule Worms
IDS Mannheim Institut für Deutsche Sprache, Mannheim
Uni Würzburg Julius-Maximilians-Universität Würzburg, Institut für Deutsche Philologie
MüZe Ludwig-Maximilians-Universität München, Münchener Zentrum für Editionswissenschaften
MPDL Max Planck Digital Library, auch in Vertretung für Max Planck Institute for Psycholinguistics (Nijmegen, Holland) und das Max-Planck-Institut für Kunstgeschichte (Florenz, Italien)
TU Darmstadt Technische Universität Darmstadt, Institut für Sprach- und Literaturwissenschaft
TU Kaiserslautern Technische Universität Kaiserslautern
Uni Paderborn Universität Paderborn, Musikwissenschaftliches Seminar Detmold/Paderborn
TextGrid verfügt innerhalb des TextGridLabs über folgende Editoren und Werkzeuge und Komponenten der Infrastruktur:
Editoren und Werkzeuge
  • XML-Editor zum lokalen bearbeiten von XML-Dateien, oder auch im Grid.
  • Text-Bild-Link-Editor
  • Wörterbuch-Recherche-Tool
Komponenten der Infrastruktur
  • Nutzer- und Projektverwaltung (Datei- und Rechtemanagement)
  • Recherche-Tool ermöglicht die Suche über Struktur-, Metadaten und Volltexte in eigenen Projekten und in öffentlich zugänglichen Daten in TextGrid
  • Projektbrowser / Navigation
  • Metadaten-Editor
  • Aggregation Composers
  • Import/Export-Tool
  • Revisionen dokumentiert Zwischenstände, um Änderungen zu identifizieren
  • Publizieren (im Repository) wird unterstützt durch eine automatische Metadatenvalidierung
Beta 2011-12
  • DigiLib ist ein Bildbetrachtungs- und Referenzierungstool
  • Noten-Editor MEISE
  • Workflow-Tool
  • Lemmatizer
  • COSMAS II (Corpus Search, Management and Analysis System)
  • LEXUS (Language Archiving Technology) bietet lexikalische Datenbanken
Da es sich bei TextGrid nicht im traditionellen Sinn um ein Tool handelt, sind Angaben hinsichtlich methodologische Einordnung und Arbeits- und Analyseschritte schwierig, da gewissermaßen sowohl qualitative als auch quantitative, händische und automatische Schritte möglich sind. Mit der Beta-Version erweitert sich auch die methodologische Einordnung. Da nicht nur Texte annotiert werden können, sondern auch Bild-Text-Verknüpfungen oder Musiknoten annotiert werden können, erweitert sich das Forschungsfeld um viele Geisteswissenschaften.

Allgemeine Voraussetzungen

  • kostenfreie Nutzung von TextGrid – Open Source
  • kostenfreie Registrierung und Freischaltung für die Nutzung der TextGridLab Tools und TextGrid Community Services nötig (ggf. Angabe der Forschungseinrichtung nötig)
  • Internetzugang zum Austausch in der Community und Zugriff auf TextGridRep nötig
  • von einem USB Stick aus auch Zugang zu TextGridLap, portabel, sonst Download für TextGridLab nötig
  • TextGridLab ist verfügbar als aktuelle stabile Version: 1.0.1 - Revision 11114 (2011-09-12) und als atuelle Beta-Version: Dezember 2011 - Revision11641 (2011-12-07)
  • Betriebssysteme: Linux (32Bit / 64Bit), Mac OS X (32 Bit / 64 Bit), Windows – Android bzw. generell Software für Tablet PCs sind in Arbeit
  • (Hinweis: Bei Ubuntu 11.04 muss ggf. der benötigte xulrunner 1.9.2 nachinstalliert werden.)
  • aktuelle Version von Java nötig
  • browserbasierter, registierungsnfreier Zugang und Zugriff zu TextGridRep (Veränderungen nur nach Registrierung über das TextGridLab möglich
  • nutzbar für die Browser: InternetExplorer, Opera, Mozilla und FireFox, GoogleChrome, Safari
  • User Manual als Print- und Web-pdf Versionen kostenfrei herrunterladbar
  • Daten und Ergebnisse aus dem TextGridRep können exportiert und auf der lokalen oder externen Festplatte gespeichert werden, Daten und Ergebnisse aus dem TextGridLab können lokal, extern und online gespeichert, ex- und importiert werden
  • auf deutsch und englisch verfügbar

Detaillierte Beschreibung des Tools

Avatar von TextGrid
I. Phase 2006-2009 umfasste nur Sprach- und Literaturwissenschaftler als Zielgruppe
II. Phase 2009-2012 (aktuell laufend) umfasst nebst Sprach- und Literaturwissenschaft auch Musikwissenschaftler und Kunsthistoriker

Gegenwärtig (24.02.2012) befindet sich TextGrid somit in der II. Phase des Projektes, das eine Virtuelle Forschungsumgebung mit zwei großen Tools, TextGridRep und TextGridLab, darstellt. TextGridLab enthält weitere Tools, die hier nach den Ausführungen zu TextGridRep dargestellt werden sollen.

Aufbau von TextGrid
Infrastruktur von TextGrid
Architektur von TextGrid
Avatar von TextGrid














TextGridRep

TextGridLab

Aktuelle stabile Version 1.0

Beta-Version

Ausblick

Daten-Einspeisung

Web-Storage-Charakter?

Generell kommt es bei TextGrid auf das spezifische Erkenntnisinteresse und den Bearbeitungswunsch an, wenn die Frage der möglichen Daten-Einspeisung näher beleuchtet werden soll. Da die Möglichkeit besteht, Projekte und in TextGridLab annotierte (oder vorher annotierte) Texte online zu speichern, so dass man von jedem beliebigen Rechner per USB Stick nach dem LogIn auf diese Daten zugreifen kann, sie importieren und exportieren kann, ist zunächst nahezu jedes Format einspeisbar, so dass ein Projektpartner sich dieses exportieren kann und anderweitig bearbeiten kann. Somit hat TextGrid gewissermaßen einen Web-Storage-Charakter, mit der Transparenz einer gewissen Chronik. Inwiefern die Dokumente im Anschluss nach dem "Zwischenspeichern" noch nutzbar sind außerhalb von TextGrid, und ob es somit wirklich als eine Art Web-Storage betrachtet werden kann, steht somit noch in Frage. Im Unterschied zu anderen Tools lassen sich Dateien des "falschen" Formats zumindest importieren, und das Lab such nach einem Editor, den es jedoch bei folgenden Dateitypen gegenwärtig (24.02.2012) nicht findet: *.rar, *.zip, *.pdf, *.doc, *.docx, *.odt, *.ppt, *.mp3, *.avi.

Unterstütze Formate

Problemfrei zu importieren und zu nutzen sind Dateien des Typs: *.txt, *.rtf, *.xml, *.jpg, *.png [Ergänzungen folgen] Auch bereits in TextGridLab erstellte *.xml TEI-Metadaten (TEI = Text Encoding Initiative) oder aus dem Rep exportierte Dateien sind einspeisbar und nutzbar. Eine Dateigrößenbeschränkung trat bisher nicht auf (Versuch bis 6MB Einzeldatei). Das Import-Tool des Labs ermöglicht per einfachem Drag&Drop das Zusammenstellen eigener Korpora innerhalb eines Projekts und erlaubt dabei explizit die Mischung verschiedener Dateitypen (z.B. *.png und *.txt), die diese, anders als bei bisherigen Tools, Text und Bild verknüpfen können. Jedoch können auch Einzeltexte hochgeladen werden. Vor-annotierte Texte sind möglich, da es sich um einen Forschungsverbund handelt liegt die Annotation im jeweiligen Interesse der Forschungsgruppe und kann z.Z. noch nicht ausreichend beantwortet werden. Ein *.xml Annotierung ist nützlich, kann aber auch im Lab vorgenommen werden. Die Urheberrechtsfrage ist bei den Texten, die im Rep verfügbar sind, transparent gemacht. Wünschenswert und möglich ist dies im Meta-Daten-Editor im Lab.

Benutzerfreundlichkeit

Allgemeine Nutzerfreundlichkeit

Die Fülle an Möglichkeiten kann den ungeübten Benutzer im ersten Moment überfordern, aber nach wenigen Minuten ist ein intuitives Bedienen von TextGrid möglich. Das Rep verfügt über eine benutzerfreundliche, optisch ansprechende Oberfläche. Gleiches gilt für das Lab, das durch die Ikone und Symbole auf den Buttons sehr intuitiv und benutzerfreundlich ist. Selbiges kann auch für die übersichtliche, sehr informative Homepage festgehalten werden, die auch über ein knappes F.A.Q. verfügt. Da es sich bei TextGrid um mehr als ein Tool, nämlich um eine Forschungsumgebung handelt, die als Zielgruppe Geistes- und Kulturwissenschaftlerln bei Austausch und Forschung eine Unerstützung sein soll, steht Benutzerfreundlichkeit an erster Stelle. Dies ermöglicht auch Einsteigern nach einer kurzen Einarbeitungsphase, eine Nutzbarmachung, je nach Erkenntnisinteresse. Das Wörtbuch-Tool beispielsweise, ist extrem intuitiv und durch seine Verknüofungen, interdisziplinär auch für Einsteiger sofort nutzbar.

Glossar

Neben einem knappen Eintrag auf der deutschen Wikipedia und der englischsprachigen Wikipedia, gibt das jedoch nur in englisch vorhandene, digitale (oder bei der SUB Göttingen gedruckt erfragbare) Benutzerhandbuch Hilfestellung. Da das TextGridLab selbst in englischer Sprache auftritt, ist ein Manual nur in englisch jedoch nicht störend. Vor allem im Hinblick auf den internationalen Austausch den TextGrid anstrebt, bietet sich diese Vereinheitlichung an. Korpora, Texte und Projekte sind jedoch auch problemfrei in deutsch eingespeist und einspeisbar.

Problembehandlung

Bei Fragen steht neben dem ausführlichen "Help"-Button im Lab außerdem das Team von TextGrid gerne per E-Mail zur Verfügung, oder die Nutzertreffen können Aufschluss geben. Das Team freut sich über Verbesserungsvorschläge und Erweiterungsideen ausdrücklich. Ein ausführliches Demo-Video (auch zum freien Download in hoher Qualität auf der Webseite verfügbar, Windows Media Player nötig) gibt erste Einblicke in die essentiellen Lab Tools. Bei der Nutzung der Editoren, vor allem des XML-Editors, sind basale Programmierkenntnisse von Vorteil, aber nicht zwingend nötig, da das Handbuch und das Demo-Video weiterhelfen. Auch einge YouTube-Videos, die exemplarisch Funktionen von TextGrid zeigen, sind verfügbar. Besonders spannend sind hierbei Vergleiche zwischen älteren, einige Jahre zurück liegenden, und jüngeren Videos, welche die Weiterentwicklung von TextGrid veranschaulichen.

Transparenz

Als wissenschaftliche Forschungsumgebung verfügt TextGrid wie wenig andere Tools über eine derartig enorme Transparenz. Das "Innenleben" der Tools und der gesamten Forschungsumgebund ist detailiert einsehbar und jeder Schritt der Weiterentwicklung, Fehlermeldung und Veränderungen nachvollziehbar.

Transparenz des Innenlebens von TextGrid
Feedback-Fomular auf der Entwicklerseite: http://www.textgrid.de
Transparenz der im Archiv und für Arbeit nutzbaren Textedition sowie Downloadmöglichkeit der Meta-Deten im TEI-Format
Transparenz bei Lizenzen im Rep


Anhand des Vorgangsnavigators lässt sich außerdem jeder einzelne Vorgang der Veränderung nachvollziehen, noch ausstehende Veränderungen oder den Status der Bearbeitung von Updates nachvollziehen. Inbesondere sorgt die Angabe des Namens des Bearbeiters für Transparenz.

Die Entwickler weisen auf ihrer Webseite auf bekannte Probleme wie mit der jüngsten Ubuntu-Version, Windows XP Darstellung bei der Beta-Version oder benötigte aktuelle Javaversion hin. Außerdem verweisen sie auf alle ihnen bekannten Fehler anhand des Ticket-System JIRA und bieten Hilfeleistung per E-Mail support(at)textgrid.de

Auch das explizit Angelegte Feedbackformular lädt ein, an dem Projekt aktiv mitzuarbeiten und es stetig zu verbessern. Die aktuelle Version TextGrid 1.0 wird als stabil beschrieben, die Beta-Version enthält deutlich mehr Tools, wird aber auch explizit als instabil betrachtet. TextGrid basiert auf der Open Source Community Software ECLIPSE.

Federführend für die Transparenz ist die Möglichkeit, sowohl im Lab als auch Rep Metadaten im Format TEI herunterzulanden. Neben einer absoluten Editionsklarheit, sind auch die Lizenzen im Rep gut nachvollziehbar.

Fazit

Text Text Text Text Text Text Text Text Text Text Text Text Text Text Text Text

Beispielanwendung

Literatur

vgl. Veröffentlichungen von und über TextGrid

  • André Moreira: LEXUS on the TextGrid infrastructure – exploring new potentialities. In: Language Archiving Technology - News, Dezember 2011
  • Patrick Harms, Jens Grabowski: Usability of Generic Software in e-Research Infrastructures. In: Journal of the Chicago Colloquium on Digital Humanities and Computer Science, Volume 1, Number 3 (2011).
  • EHRI (Hrsg.): 'If You Build It, They Will Come'- Inauguration of Göttingen Centre for Digital Humanities. In: EHRI Newsletter, November 2011.
  • Heike Neuroth, Felix Lohmeier, Kathleen Marie Smith: TextGrid - Virtual Research Environment for the Humanities. In: The International Journal of Digital Curation, Issue 2, Volume 6, 2011 (Proceedings of the 6th International Digital Curation Conference, Chicago, USA, Dec 2010)
  • Thomas Rings, Andreas Aschenbrenner, Jens Grabowski, Tibor Kalman, Gerhard Lauer, Jörg Meyer, Arnulf Quadt, Ulrich Sax, Fred Viezens: An Interdisciplinary Practical Course on the Application of Grid Computing. In: Proceedings of the 1st Annual IEEE Engineering Education Conference – The Future of Global Learning in Engineering Education (EDUCON 2010), Madrid, 2010.
  • Marc Wilhelm Küster, Christoph Ludwig, Yahya Al-Hajj, Andreas Aschenbrenner: TextGrid: eScholarship und der Fortschritt der Wissenschaft durch vernetzte Angebote. In: Jörg Sieglerschmidt – H. Peter Ohly (Hrsg.): Wissensspeicher in digitalen Räumen. Würzburg: Ergon Verlag, 2010. S. 193-205. (Fortschritte in der Wissensorganisation, Band 11).
  • DARIAH (Hrsg.): German Grid Activities Related to DARIAH. In: DARIAH Newsletter No.5, Februar 2010. S. 4-6.
  • Dr. Annamaria Carusi, Dr. Torsten Reimer: TextGrid – Virtual Research Environment in the e-Humanities. In: Virtual research environment collaborative landscape study - A JISC funded project. Januar 2010. S. 92-94.
  • Marina Müller, Gisela Minn: Der wissenschaftliche Arbeitsplatz der Zukunft - Internationale Tagung: „Virtuelle Forschungsplattformen in Geisteswissenschaften“. In: Trierer Unijournal 01/2010. S. 40-41.
  • Roland S. Kamzelak: Materialwirtschaft. In: editio - Internationales Jahrbuch für Editionswissenschaft (Hrsg: Rüdiger Nutt-Kofoth, Bodo Plachta, Winfried Woesler), Band 23, 2009.
  • GridTalk (Hrsg.): Digitising culture: Grids and eHumanities. In: Grid Briefings – Grid Computing in five minutes, Heft 10, Dezember 2009. S. 2.
  • Lukas Gießmann, Marc Wilhelm Küster, Christoph Ludwig: Isidorus-UI: Generating a User Interface with Topic Maps Constraint Language and JavaScript Object Notation. Paper for the TMRA 2009.
  • Christian Schneiker, Dietmar Seipel: Declaratively Creating and Processing XML/TEI Data. Paper for the TEI Conference 2009: Text encoding in the era of mass digitization, Nov. 9-15, 2009.
  • Martina Kerzel, Jens Mittelbach, Thorsten Vitt: TextGrid - Virtuelle Arbeitsumgebung für die Geisteswissenschaften. In: Künstliche Intelligenz, Themenheft "Kulturerbe und Künstliche Intelligenz", Heft 4, November 2009. S. 36-39.
  • Andreas Aschenbrenner, Marc Wilhelm Küster, Christoph Ludwig, Thorsten Vitt: Open eHumanities Digital Ecosystems and the Role of Resource Registries. In: Proceedings of the 3rd IEEE International Conference on Digital Ecosystems and Technologies, Istanbul, 2009. S. 745-750.
  • Christian Schneiker, Dietmar Seipel, Werner Wegstein: Schema and Variation: Retro-Digitizing Printed Dictionaries. In: Proceedings of the Third Linguistic Annotation Workshop, ACL-IJCNLP 2009. S. 82-89.
  • Marc Wilhelm Küster, Christoph Ludwig, Andreas Aschenbrenner: TextGrid: eScholarship und vernetzte Angebote. In: it - Information Technology, Themenheft „Informatik in den Philologien“ (Gastherausgeber: Claude Moulin, Thomas Burch, Andrea Rapp), Heft 4, August 2009.
  • Stefan Büdenbender, Michael Leuk: Daten als Dienste: Wörterbücher als Erschließungsinstrumente in der virtuellen Arbeitsumgebung "TextGrid". In: it-Information Technology, Themenheft „Informatik in den Geisteswissenschaften“ (Gastherausgeber: Claudine Moulin, Thomas Burch, Andrea Rapp), Heft 4, August 2009. S. 191-196.
  • Perspektiven des Digitalen Publizierens. Interview mit Andrea Rapp im Deutschlandfunk am 6.7.2009.
  • Heike Neuroth, Fotis Jannidis, Andrea Rapp, Felix Lohmeier: Virtuelle Forschungsumgebungen für e-Humanities. Maßnahmen zur optimalen Unterstützung von Forschungsprozessen in den Geisteswissenschaften. In: Bibliothek. Forschung und Praxis, 2009/2, S. 161-169.
  • Marie-José Klaver: De Ub als digitale Bibliotheek. In: SPUI 30, UvA Alumni Magazine 02/2009. S. 10-13.


Abschlussarbeiten

  • Andreas Aschenbrenner: Reference Framework for Distributed Repositories – Towards an Open Repository Environment, Dissertation am Göttinger Zentrum für Informatik, 25.11.2009.
  • Ubbo Veentjer: Determination of Relevant Words within a Text and Representation in the User Interface TextGrid-Workbench,Bachelorarbeit am Göttinger Zentrum für Informatik, 29.4.2009.
  • Roman Hausner: Semantic Text Mining - linguistische Tools im Preprocessing von Text Mining Methoden, Bachelorarbeit am Göttinger Zentrum für Informatik, 29.4.2009.

Weblinks