TextGrid
ACHTUNG: Hier entsteht gerade ein Eintrag zu TextGrid unter Zuhilfenahme von Dragon Natuarally Speaking Software. Alle Inhalte sind vorläufig :-)
- Trotz Vorläufigkeit ;): Ich hab bei "Literatur" nur die zitierte Literatur angegeben ... Haltet ihr's für sinnvoll, weitere Literaturtipps anzugeben? s.e.
- Ich hab mir das auch schon überlegt und dann entschieden in Wikipedia-Art alle vorhandene Literatur die ich finden konnte zum Thema zusammenzustellen, weil es ja zur Vertiefung dient.Oder nicht?Danke!Sollten wir diskutieren! M.H.
Bei TextGrid handelt es sich um eine Virtuelle Forschungsumgebung, entwickelt von einem Forschungsverbund, dessen Ziel es ist, den Zugang und den Austausch von Informationen in den Geistes- und Kulturwissenschaften mit Hilfe moderner Informationstechnologie (Grid) möglich zu machen, zu unterstützen und zu fördern. Insbesondere gilt dies gegenwärtig für Editionsphilologen, Linguisten, Musikwissenschaftler und Kunsthistoriker.
- "TextGrid umfasst Werkzeuge, Infrastrukturentwicklung und Grid-Technologien. Geistes- und Kulturwissenschaftler werden durch TextGrid in die Lage versetzt, in einer verteilten, sicheren, flexiblen und erweiterbaren Forschungsumgebung zusammenzuarbeiten und gemeinsam Werkzeuge, Daten und Methoden zu nutzen."
- "Warum TextGrid?" - Die Entwickler nennen 10 Gründe, 24.02.2012
Dabei sind insbesondere die beiden Tools TextGridRep und TextGridLab, nebst der transparenten, aktiven Community der Forscher zu nennen:
- Bei TextGridRep handelt es sich um das Repository, eine digitale Bibliothek und geisteswissenschaftliches Langzeitarchiv.
- Bei TextGridLab handelt es sich um das Laboratory, den Einstiegspunkt in die Virtuelle Forschungsumgebung mit zahlreichen Werkzeugen und Services.
Das Verbundprojekt wird von Juni 2009 bis Mai 2012 vom Bundesministerium für Bildung und Forschung (BMBF) gefördert.
Kurzbeschreibung des Tools
Die Beschreibungen orientieren sich stark an der Selbstpräsentation von TextGrid.' Die Virtuelle Forschungsumgebung TextGrid ist vorrangig in zwei unterschiedliche Komponenten aufgeteilt:
- TextGridLab: dem TextGrid Laboratory, zu verstehen als der Einstiegspunkt in die Virtuelle Forschungsumgebung, mit Zugriff auf Werkzeuge und Services in einer intuitiv bedienbaren Software.
- TextGridRep: dem TextGrid Repository, das ein Geisteswissenschaftliches Langzeitarchiv in einer Grid-Infrastruktur darstellt, und damit eine langfristige Verfügbarkeit und Zugänglichkeit der Forschungsdaten garantiert.
Die Staats- und Universitätsbibliothek Göttingen ist gegenwärtig (Stand:Febaruar 2012) mit der Projektleitung betraut.
Der TextGrid Forschungsverbund besteht aus folgenden Partnern:
- SUB Göttingen Georg-August-Universität Göttingen, Niedersächsische Staats- und Universitätsbibliothek Göttingen (Projektleitung)
- DAASI DAASI International GmbH, Tübingen
- FH Worms Fachhochschule Worms
- IDS Mannheim Institut für Deutsche Sprache, Mannheim
- Uni Würzburg Julius-Maximilians-Universität Würzburg, Institut für Deutsche Philologie
- MüZe Ludwig-Maximilians-Universität München, Münchener Zentrum für Editionswissenschaften
- MPDL Max Planck Digital Library, auch in Vertretung für Max Planck Institute for Psycholinguistics (Nijmegen, Holland) und das Max-Planck-Institut für Kunstgeschichte (Florenz, Italien)
- TU Darmstadt Technische Universität Darmstadt, Institut für Sprach- und Literaturwissenschaft
- TU Kaiserslautern Technische Universität Kaiserslautern
- Uni Paderborn Universität Paderborn, Musikwissenschaftliches Seminar Detmold/Paderborn
Editoren und Werkzeuge
- XML-Editor zum lokalen bearbeiten von XML-Dateien, oder auch im Grid.
- Text-Bild-Link-Editor
- Wörterbuch-Recherche-Tool
- Nutzer- und Projektverwaltung (Datei- und Rechtemanagement)
- Recherche-Tool ermöglicht die Suche über Struktur-, Metadaten und Volltexte in eigenen Projekten und in öffentlich zugänglichen Daten in TextGrid
- Projektbrowser / Navigation
- Metadaten-Editor
- Aggregation Composers
- Import/Export-Tool
- Revisionen dokumentiert Zwischenstände, um Änderungen zu identifizieren
- Publizieren (im Repository) wird unterstützt durch eine automatische Metadatenvalidierung
- DigiLib ist ein Bildbetrachtungs- und Referenzierungstool
- Noten-Editor MEISE
- Workflow-Tool
- Lemmatizer
- COSMAS II (Corpus Search, Management and Analysis System)
- LEXUS (Language Archiving Technology) bietet lexikalische Datenbanken
Allgemeine Voraussetzungen
- kostenfreie Nutzung von TextGrid – Open Source
- kostenfreie Registrierung und Freischaltung für die Nutzung der TextGridLab Tools und TextGrid Community Services nötig (ggf. Angabe der Forschungseinrichtung nötig)
- Internetzugang zum Austausch in der Community und Zugriff auf TextGridRep nötig
- von einem USB Stick aus auch Zugang zu TextGridLap, portabel, sonst Download für TextGridLab nötig
- TextGridLab ist verfügbar als aktuelle stabile Version: 1.0.1 - Revision 11114 (2011-09-12) und als atuelle Beta-Version: Dezember 2011 - Revision11641 (2011-12-07)
- Betriebssysteme: Linux (32Bit / 64Bit), Mac OS X (32 Bit / 64 Bit), Windows – Android bzw. generell Software für Tablet PCs sind in Arbeit
- (Hinweis: Bei Ubuntu 11.04 muss ggf. der benötigte xulrunner 1.9.2 nachinstalliert werden.)
- aktuelle Version von Java nötig
- browserbasierter, registierungsnfreier Zugang und Zugriff zu TextGridRep (Veränderungen nur nach Registrierung über das TextGridLab möglich
- nutzbar für die Browser: InternetExplorer, Opera, Mozilla und FireFox, GoogleChrome, Safari
- User Manual als Print- und Web-pdf Versionen kostenfrei herrunterladbar
- Daten und Ergebnisse aus dem TextGridRep können exportiert und auf der lokalen oder externen Festplatte gespeichert werden, Daten und Ergebnisse aus dem TextGridLab können lokal, extern und online gespeichert, ex- und importiert werden
- auf deutsch und englisch verfügbar
Detaillierte Beschreibung des Tools
- I. Phase 2006-2009 umfasste nur Sprach- und Literaturwissenschaftler als Zielgruppe
- II. Phase 2009-2012 (aktuell laufend) umfasst nebst Sprach- und Literaturwissenschaft auch Musikwissenschaftler und Kunsthistoriker
- TextGrid – Vernetzte Forschungsumgebung in den eHumanities
- EScience-Methoden für die Geisteswissenschaften
- TextGrid ist ein Verbundprojekt mit zehn Partnern und wird für die Laufzeit von drei Jahren vom Bundesministerium für Bildung und Forschung (BMBF) gefördert.
- Die Infrastruktur besteht vorrangig aus zwei Komponenten:
- Wie wird gearbeitet:
- Automatische oder händische Arbeitsschritte
- Art der Analyse:
- Ausgabedaten:
- Rohe Daten (Frequenzen, n-Gramme, Konkordanzen etc.); statistische Ergebnisse (z-score / log-likelihood Wert / chi-square Wert etc.)- Visualisierungen (Frequenzen, time line, story plot etc.)- Dateiformate (pdf, xml, txt etc.) ...
- ===TextGridRep===
- ===TextGridLab===
- ====Aktuelle stabile Version 1.0====
- ====Beta-Version====
- == '''Daten-Einspeisung''' ==
- ===Web-Storage-Charakter?===
- Generell kommt es bei TextGrid auf das spezifische Erkenntnisinteresse und den Bearbeitungswunsch an, wenn die Frage der möglichen
- ===Unterstütze Formate===
- Auch bereits in TextGridLab erstellte *.xml TEI-Metadaten (TEI = Text Encoding Initiative) oder aus dem Rep exportierte
- Dateien sind einspeisbar und nutzbar. Eine Dateigrößenbeschränkung trat bisher nicht auf (Versuch bis 6MB Einzeldatei).
- Das Import-Tool des Labs ermöglicht per einfachem Drag&Drop das Zusammenstellen eigener Korpora innerhalb eines Projekts
- Und erlaubt dabei explizit die Mischung verschiedener Dateitypen (z.B. *.png und *.txt), die diese, anders als bei bisherigen Tools, Text und Bild verknüpfen können. Jedoch können auch Einzeltexte hochgeladen werden.
- Die Urheberrechtsfrage ist bei den Texten, die im Rep verfügbar sind, transparent gemacht. Wünschenswert und möglich ist dies im Meta-Daten-Editor im Lab.
- == '''Benutzerfreundlichkeit ''' ==
- ===Allgemeine Nutzerfreundlichkeit===
- ===Glossar===
- ===Problembehandlung===
- == '''Transparenz''' ==
- Als wissenschaftliche Forschungsumgebung verfügt TextGrid wie wenig andere Tools über eine derartig enorme Transparenz.
- Einzelne Vorgang der Veränderung nachvollziehen, noch ausstehende Veränderungen oder den Status der Bearbeitung von Updates nachvollziehen. Inbesondere sorgt die Angabe des Namens des Bearbeiters für Transparenz.
- Auch das explizit Angelegte Feedbackformular lädt ein, an dem Projekt aktiv mitzuarbeiten und es stetig zu verbessern.
- Federführend für die Transparenz ist die Möglichkeit, sowohl im Lab als auch Rep Metadaten im Format TEI herunterzulanden.
- Neben einer absoluten Editionsklarheit, sind auch die Lizenzen im Rep gut nachvollziehbar.
- == '''Fazit''' ==
- Auf ihrer Homepage nennen die Entwickler 10 Gründe, warum TextGrid unterstützenswert ist:
- "TextGrid umfasst Werkzeuge, Infrastrukturentwicklung und Grid-Technologien. Geistes- und Kulturwissenschaftler werden durch
- TextGrid in die Lage versetzt, in einer verteilten, sicheren, flexiblen und erweiterbaren Forschungsumgebung zusammenzuarbeiten
- Und gemeinsam Werkzeuge, Daten und Methoden zu nutzen.
- Die Entwickler selbst sind sich der Differenz zu anderen Tools, aber auch der zukunftsweisenden für die eHumanities bewusst, indem sie postulieren:
- Komplexere Fragestellungen erfordern eine größere händische Aufbereitung, werden jedoch durch die Tools angenehm gestützt, wie die Beispielanwendung zeigt.
- == '''Beispielanwendung''' ==
- ===Vorüberlegungen und Hypothese(n)===
- ===Primäres Untersuchungsobjekt===
- Sebastian 23 – Identität
- In: Petra Anders (Hg.): Texte und Materialien für den Unterricht. Slam Poetry.
- Für die Sekundarstufe. Stuttgart 2008, S.35-36.
- ===Vorgehen===
- ====Text-Suche und Projekt/Usermanagement====
- ====Importieren, annotieren und Projektabschluss====
- Da der Text nicht vorhanden ist, entnahm ich ihn der einzigen Quelle, einem Reclam-Heft, und importierte die Datei als *.txt Datei.
- ====Fazit der Anwendung====
- Die Forschungsumgebung TextGrid bietet deutlich nützliche Tools, v.a. das Wörterbuch-Tool in Verbindung mit dem Editor.
- Insbesondere das anschließend leichte publizieren, die Transparenz und die Möglichkeit, andere Forscher in ein Projekt einzubeziehen, eröffnen große Möglichkeiten. So groß allerdings, dass man alleine nicht zwingend befriedigende Ergebnisse erzielt,
- Wenn man eine sehr spezifische Fragestellung hat, wie in meinem Fall. Die Unterstützung aus der Community ist hierbei der markante
- Dreh- und Angelpunkt. Diese fehlte mir gänzlich, da die "*@textgrid.de" E-Mailadresse keine ist, mir die Meta-Kommunikation somit abgesehen von Nutzertreffen noch unschlüssig ist.
- == '''Literatur''' ==
- * André Moreira: LEXUS on the TextGrid infrastructure – exploring new potentialities. In: Language Archiving Technology - News, Dezember 2011
- * Patrick Harms, Jens Grabowski: Usability of Generic Software in e-Research Infrastructures. In: Journal of the Chicago Colloquium on Digital Humanities and Computer Science, Volume 1, Number 3 (2011).
- * EHRI (Hrsg.): 'If You Build It, They Will Come'- Inauguration of Göttingen Centre for Digital Humanities. In: EHRI Newsletter, November 2011.
- * DARIAH (Hrsg.): German Grid Activities Related to DARIAH. In: DARIAH Newsletter No.5, Februar 2010. S. 4-6.
- * Dr. Annamaria Carusi, Dr. Torsten Reimer: TextGrid – Virtual Research Environment in the e-Humanities. In: Virtual research environment collaborative landscape study - A JISC funded project. Januar 2010. S. 92-94.
- * Marina Müller, Gisela Minn: Der wissenschaftliche Arbeitsplatz der Zukunft - Internationale Tagung: „Virtuelle Forschungsplattformen in Geisteswissenschaften“. In: Trierer Unijournal 01/2010. S. 40-41.
- * Roland S. Kamzelak: Materialwirtschaft. In: editio - Internationales Jahrbuch für Editionswissenschaft (Hrsg: Rüdiger Nutt-Kofoth, Bodo Plachta, Winfried Woesler), Band 23, 2009.
- * GridTalk (Hrsg.): Digitising culture: Grids and eHumanities. In: Grid Briefings – Grid Computing in five minutes, Heft 10, Dezember 2009. S. 2.
- * Lukas Gießmann, Marc Wilhelm Küster, Christoph Ludwig: Isidorus-UI: Generating a User Interface with Topic Maps Constraint Language and JavaScript Object Notation. Paper for the TMRA 2009.
- * Christian Schneiker, Dietmar Seipel: Declaratively Creating and Processing XML/TEI Data. Paper for the TEI Conference 2009: Text encoding in the era of mass digitization, Nov. 9-15, 2009.
- * Martina Kerzel, Jens Mittelbach, Thorsten Vitt: TextGrid - Virtuelle Arbeitsumgebung für die Geisteswissenschaften. In: Künstliche Intelligenz, Themenheft "Kulturerbe und Künstliche Intelligenz", Heft 4, November 2009. S. 36-39.
- * Christian Schneiker, Dietmar Seipel, Werner Wegstein: Schema and Variation: Retro-Digitizing Printed Dictionaries. In: Proceedings of the Third Linguistic Annotation Workshop, ACL-IJCNLP 2009. S. 82-89.
- * Perspektiven des Digitalen Publizierens. Interview mit Andrea Rapp im Deutschlandfunk am 6.7.2009.
- * Marie-José Klaver: De Ub als digitale Bibliotheek. In: SPUI 30, UvA Alumni Magazine 02/2009. S. 10-13.
- '''Abschlussarbeiten'''
- *Andreas Aschenbrenner: Reference Framework for Distributed Repositories – Towards an Open Repository Environment, Dissertation am Göttinger Zentrum für Informatik, 25.11.2009.
- *Ubbo Veentjer: Determination of Relevant Words within a Text and Representation in the User Interface TextGrid-Workbench,Bachelorarbeit am Göttinger Zentrum für Informatik, 29.4.2009.
- * Roman Hausner: Semantic Text Mining - linguistische Tools im Preprocessing von Text Mining Methoden, Bachelorarbeit am Göttinger Zentrum für Informatik, 29.4.2009.
- == '''Weblinks''' ==