Hauptseite: Unterschied zwischen den Versionen

Aus Literatur Rechnen - Neue Wege der Textanalyse
Wechseln zu: Navigation, Suche
(Literatur rechnen. Ein Wiki zur digitalen Textanalyse)
(Literatur rechnen. Ein Wiki zur digitalen Textanalyse)
Zeile 22: Zeile 22:
  
  
[[Datei:Wordle_Sandmann.jpg|200px|thumb|left|Fig.1 - E.T.A. Hoffmann: ''Der Sandmann'' ohne Stopwörter]]
+
[[Datei:Wordle_Sandmann.jpg|200px|thumb|left|Fig.1 - E.T.A. Hoffmann: ''Der Sandmann'' ohne Stoppwörter]]
  
  
Einen ersten Eindruck von den Möglichkeiten des "Rechnens von Literatur" gibt die Visualisierung von Worthäufigkeiten in Form von "word clouds" (siehe Fig.1). Die am häufigsten auftretenden Wörter werden hier am größten dargestellt, die weniger häufigen Wörter graduell kleiner. Nachdem zunächst Wörter entfernt wurden, die im Deutschen allgemein sehr häufig sind (sogenannte Stopwörter wie Konjunktionen, Artikel und Formen von "sein"), fällt auf, dass die Eigennamen der Figuren (Nathanael, Klara, Coppelius/Coppola, Olimpia) sowie die Bezeichnungen "Sandmann" und "Mutter" besonders häufig sind. Zu den meisthäufigen Wörtern gehören auch "Augen", "wohl", "immer" und "ganz". Dieser erste, in wenigen Sekunden generierte Überblick kann als Heuristik für die weitere Analyse des Textes dienen. Zum einen reflektieren die meisthäufigen Wörter den Inhalt der Erzählung im Hinblick auf die Figuren und auf das zentrale Motiv der "Augen". Der Befund, dass "Augen" nicht nur qualitativ, sondern auch quantitativ eine besondere Rolle spielen, ist nicht trivial. Ausgehend von den Worthäufigkeiten könnte die weitere Analyse weniger eindeutige Elemente in den Blick nehmen, zum Beispiel "wohl", das adverbiell, partikelhaft, konjunktional oder adjektivisch gebraucht werden kann, wobei die Bedeutungen stark divergieren können. "Wohl" kann z.B. ausdrücken "dass ein Zweifel entkräftet werden soll; durchaus, ohne weiteres" (DWDS) - aber auch, dass eine Ungewissheit eingeräumt wird: "wahrscheinlich, anscheinend, vermutlich" (DWDS). In Bezug auf ''Der Sandmann'', eine Erzählung, die mit der Verschränkung von Realem und Irrealem in der erzählten Welt spielt, ist es also spannend zu klären, welche Funktion das Wort "wohl", als eines der häufigsten im Text hat.
+
Einen ersten Eindruck von den Möglichkeiten des "Rechnens von Literatur" gibt die Visualisierung von Worthäufigkeiten in Form von "word clouds" (siehe Fig.1). Die am häufigsten auftretenden Wörter werden hier am größten dargestellt, die weniger häufigen Wörter graduell kleiner. Nachdem zunächst Wörter entfernt wurden, die im Deutschen allgemein sehr häufig sind (sogenannte Stoppwörter wie Konjunktionen, Artikel und Formen von "sein"), fällt auf, dass die Eigennamen der Figuren (Nathanael, Klara, Coppelius/Coppola, Olimpia) sowie die Bezeichnungen "Sandmann" und "Mutter" besonders häufig sind. Zu den meisthäufigen Wörtern gehören auch "Augen", "wohl", "immer" und "ganz". Dieser erste, in wenigen Sekunden generierte Überblick kann als Heuristik für die weitere Analyse des Textes dienen. Zum einen reflektieren die meisthäufigen Wörter den Inhalt der Erzählung im Hinblick auf die Figuren und auf das zentrale Motiv der "Augen". Der Befund, dass "Augen" nicht nur qualitativ, sondern auch quantitativ eine besondere Rolle spielen, ist nicht trivial. Ausgehend von den Worthäufigkeiten könnte die weitere Analyse weniger eindeutige Elemente in den Blick nehmen, zum Beispiel "wohl", das adverbiell, partikelhaft, konjunktional oder adjektivisch gebraucht werden kann, wobei die Bedeutungen stark divergieren können. "Wohl" kann z.B. ausdrücken "dass ein Zweifel entkräftet werden soll; durchaus, ohne weiteres" (DWDS) - aber auch, dass eine Ungewissheit eingeräumt wird: "wahrscheinlich, anscheinend, vermutlich" (DWDS). In Bezug auf ''Der Sandmann'', eine Erzählung, die mit der Verschränkung von Realem und Irrealem in der erzählten Welt spielt, ist es also spannend zu klären, welche Funktion das Wort "wohl", als eines der häufigsten im Text hat.
  
  

Version vom 6. Juni 2013, 12:18 Uhr

Literatur rechnen. Ein Wiki zur digitalen Textanalyse

Dieses Wiki ist ursprünglich im Wintersemester 2011/2012 an der Universität Göttingen von den Studierenden des Masterseminars "Literatur rechnen. Neue Wege der Textanalyse" unter Leitung der Dozentin Berenike Herrmann erarbeitet worden: Katrin Droste, Sarah Eilers, Ramona Heileck, Martin Hinze, Sarah Koch, Margarete Leissa, Stephanie Jennie Leitz und Stefanie Rößler (studentische Hilfskraft mit EDV-Know-How war Malte Gerloff).


Das Wiki beschreibt momentan acht Tools zur digitalen Textanalyse:

Die Artikel wurden von den Teilnehmern und Teilnehmerinnen des Kurses selbstständig erstellt und im zweiten Schitt durch "peer review" von den Komilitoninnen und Komilitonen gegengelesen. Dieses Verfahren hat nicht nur dazu beigetragen, dass die Artikel wirklich eine einheitliche Struktur aufweisen, sondern insgesamt qualitativ ziemlich hochwertig sind. Die einzelnen Artikel sollen zukünftig regelmäßig überarbeitet werden, um Weiterentwicklungen der Tools abzubilden. Bitte schreiben Sie uns mit Kommentaren, Kritik oder Fragen: bherrma1@gwdg.de

Die Autorinnen und Autoren der Originalartikel sind hier zu finden: Mitarbeiterinnen und Mitarbeiter

Die Tools, die letztlich im Wiki beschrieben werden, wurden nach den folgenden Kriterien ausgesucht: i.d.R. kostenfrei, leicht zugänglich, für AnfängerInnen gut handhabbar. Eine Vielzahl von leistungsstarken Tools wird aus praktischen Gründen nicht im Wiki abgebildet. Hier ist eine Übersicht in Arbeit: Weitere Tools

Struktur der Artikel: in Bearbeitung


Fig.1 - E.T.A. Hoffmann: Der Sandmann ohne Stoppwörter


Einen ersten Eindruck von den Möglichkeiten des "Rechnens von Literatur" gibt die Visualisierung von Worthäufigkeiten in Form von "word clouds" (siehe Fig.1). Die am häufigsten auftretenden Wörter werden hier am größten dargestellt, die weniger häufigen Wörter graduell kleiner. Nachdem zunächst Wörter entfernt wurden, die im Deutschen allgemein sehr häufig sind (sogenannte Stoppwörter wie Konjunktionen, Artikel und Formen von "sein"), fällt auf, dass die Eigennamen der Figuren (Nathanael, Klara, Coppelius/Coppola, Olimpia) sowie die Bezeichnungen "Sandmann" und "Mutter" besonders häufig sind. Zu den meisthäufigen Wörtern gehören auch "Augen", "wohl", "immer" und "ganz". Dieser erste, in wenigen Sekunden generierte Überblick kann als Heuristik für die weitere Analyse des Textes dienen. Zum einen reflektieren die meisthäufigen Wörter den Inhalt der Erzählung im Hinblick auf die Figuren und auf das zentrale Motiv der "Augen". Der Befund, dass "Augen" nicht nur qualitativ, sondern auch quantitativ eine besondere Rolle spielen, ist nicht trivial. Ausgehend von den Worthäufigkeiten könnte die weitere Analyse weniger eindeutige Elemente in den Blick nehmen, zum Beispiel "wohl", das adverbiell, partikelhaft, konjunktional oder adjektivisch gebraucht werden kann, wobei die Bedeutungen stark divergieren können. "Wohl" kann z.B. ausdrücken "dass ein Zweifel entkräftet werden soll; durchaus, ohne weiteres" (DWDS) - aber auch, dass eine Ungewissheit eingeräumt wird: "wahrscheinlich, anscheinend, vermutlich" (DWDS). In Bezug auf Der Sandmann, eine Erzählung, die mit der Verschränkung von Realem und Irrealem in der erzählten Welt spielt, ist es also spannend zu klären, welche Funktion das Wort "wohl", als eines der häufigsten im Text hat.


 Im Vorlesungskommentar war dieser Text zu finden:
 In den letzten Jahren sind ganz neue Wege computergestützter Textanalyse entstanden. Sie erlauben es, Einzeltexte wie große Text-Korpora zu analysieren und das mit 
 etablierten erzählanalytischen Verfahren wie mit ganz neuen Ansätzen, die erst der Computer ermöglicht. Das Seminar erprobt an ausgewählten Texten solche Wege, 
 Literatur zu rechnen. Zum Einsatz kommen unterschiedliche Tools zur Annotierung, zum Textmining, zur Bestimmung von Textähnlichkeiten und andere Verfahren der
 Computerstilistik, der corpus narratology und Statistik u.a.


Impressum

Mitarbeiterinnen und Mitarbeiter

Links zur Digitalen Textanalyse

Die eigenen Internetauftritte der Tools sind jeweils in den Artikeln verlinkt, hier findet man Informationen zu Korpora. Eine Auswahl von Links zum Thema digitale Textanalyse ist hier zu finden:

Weitere Tools

Eine Übersicht zu (deutschsprachigen, literarischen) Korpora ist hier zu finden:Korpora


 Bitte zitieren Sie das Wiki bei Bedarf auf die folgende Art und Weise:
 Herrmann, B. (Hg.),(2012). Literatur rechnen. Ein Wiki zur digitalen Textanalyse.(Digitale Ressource)http://litre.uni-goettingen.de/wiki/index.php/Hauptseite DOI?
 Ein einzelner Artikel zum Beispiel so:
 Droste, K. (2012). AntConc [Version: Datum]. In: B. Herrmann (Hg.), Literatur rechnen. Ein Wiki zur digitalen Textanalyse. (Digitale Ressource)http://litre.uni-goettingen.de/wiki/index.php/AntConc