Voyant: Unterschied zwischen den Versionen

Aus Literatur Rechnen - Neue Wege der Textanalyse
Wechseln zu: Navigation, Suche
K
 
(33 dazwischenliegende Versionen von 3 Benutzern werden nicht angezeigt)
Zeile 1: Zeile 1:
[[Datei:Logo.png|right|250px|thumb|Screenshot des Logos von Voyant]]Voyant (frz. für sehend, auffallend. Bis zum 19.0ktober 2011 unter dem Namen [http://hermeneuti.ca/node/212/ Voyeur] bekannt)  ist ein webbasiertes Tool zur computergestützten Analyse digitaler Texte.  Es ist Teil des unter dem Namen [http://hermeneuti.ca/ Hermeneuti.ca -  The Rhetoric of Text Analysis] laufenden, kollaborativen Projekts der Kanadier Stefan Sinclair ([http://http://www.mcgill.ca/ McGill University ]) und Geoffrey Rockwell ([http://http://www.ualberta.ca/ University of Alberta]). Das Ziel der seit 2008 bestehenden Projektgruppe ist es, die Rhetorik und die Anwendung in der computergestützten Korpusanalyse zu theoretisieren, sowie die dazu verwendeten Tools und Programme zu entwickeln und auszubauen.[http://hermeneuti.ca/voyeur] Voyant leistet diesbezüglich die quantitative Analyse von Wortfrequenzen und Konkordanzen. Im Moment ist das Tool unter drei URLs zu erreichen:
+
{| border="1"
 +
|Unser LitRe-Wiki ist seit 2012 nicht eingreifend überarbeitet worden. Es bildet also den damaligen Stand ab. Um Weiterentwicklungen der digitalen Textanalyse abzubilden, sollen nun die Artikel peu à peu überarbeitet werden, und weitere Artikel hinzukommen.
 +
 
 +
Interesse? Haben Sie Lust, einen Artikel zu überarbeiten oder neu zu verfassen? Schreiben Sie uns! Auch Kommentare, Kritik oder Fragen sind willkommen: mailto:bherrma1@gwdg.de
 +
|}
 +
 
 +
 
 +
 
 +
Voyant (frz. für sehend, auffallend. Bis zum 19.0ktober 2011 unter dem Namen [http://hermeneuti.ca/node/212/ Voyeur] bekannt)  ist ein webbasiertes, englischsprachiges Tool zur computergestützten Analyse digitaler Texte.  Es ist Teil des unter dem Namen [http://hermeneuti.ca/ Hermeneuti.ca -  The Rhetoric of Text Analysis] laufenden, kollaborativen Projekts der Kanadier Stefan Sinclair ([http://http://www.mcgill.ca/ McGill University ]) und Geoffrey Rockwell ([http://http://www.ualberta.ca/ University of Alberta]). Das Ziel der seit 2008 bestehenden Projektgruppe ist es, die Anwendung in der computergestützten Korpusanalyse zu theoretisieren, sowie die dazu verwendeten Tools und Programme zu entwickeln und auszubauen.[http://hermeneuti.ca/voyeur] Voyant offeriert in seiner übersichtlichen Analyselandschaft eine relativ große Bandbreite an kleineren Tools zur Untersuchung literarischer Texte sowie zur Visualisierung der Ergebnisse. Zudem ist die Nutzung von Voyant kompatible zu anderen Analysetools, wie beispielweise ''TaPor''. Die Projektgruppe bietet fortgeschrittenen Anwendern die Möglichkeit, mithilfe von Voyant eigene Tools zu einzubinden oder zu entwickeln. Im Moment ist das Tool unter drei URLs zu erreichen:
 
http://www.voyant-tools.org, http://voyeur.hermeneuti.ca und http://voyeurtools.org.
 
http://www.voyant-tools.org, http://voyeur.hermeneuti.ca und http://voyeurtools.org.
  
Zeile 9: Zeile 17:
 
*als bibliographische Zitation
 
*als bibliographische Zitation
 
oder
 
oder
*als tabellarisierte oder pure Datensätze
+
*als tabellarisierte oder rohe Datensätze
 
gesichert werden. Die Ausgabe dieser Sicherungsmöglichkeiten erfolgt über .xml-, .html- oder reine Text-Dateien.
 
gesichert werden. Die Ausgabe dieser Sicherungsmöglichkeiten erfolgt über .xml-, .html- oder reine Text-Dateien.
  
Zeile 15: Zeile 23:
 
==='''Das Standard-Interface'''===
 
==='''Das Standard-Interface'''===
  
[[Datei:StartseiteVoyant.jpg|left|thumb|Abb.1 Startseite ]]
+
[[Datei:StartseiteVoyant.jpg|left|thumb|Abb. 1 Startseite ]]
Unter Aufrufen einer der drei möglichen URLs http://www.voyant-tools.org, http://www.voyeur.hermeneuti.ca oder http://www.voyeurtools.org wird der Benutzer auf die Startseite des Tools geleitet.[[Datei:ADD.jpg‎|left|thumb|Abb.2 Texteinspeisung]]
+
Unter Aufrufen einer der drei möglichen URLs http://www.voyant-tools.org, http://www.voyeur.hermeneuti.ca oder http://www.voyeurtools.org wird der Benutzer auf die Startseite des Tools geleitet.[[Datei:ADD.jpg‎|left|thumb|Abb. 2 Texteinspeisung]]
Durch das mittig platzierte Eingabefeld können Texte aus verschiedenen Quellen dem zu analysierenden Korpus hinzugefügt werden (Abb.1). Dazu kann man entweder einen ganzen Volltext mithilfe von ''Copy and Paste'' in das Eingabefeld einfügen, oder gar, wenn es sich um einen online verfügbaren Text handelt, die URL des Onlinemediums in das Eingabefeld einspeisen und mit dem ''Reveal''-Button hochladen. Befindet sich die zu analysierende Textdatei auf der Festplatte des benutzten Computers, so kann mit der unter dem Eingabefeld befindlichen Upload-Funktion die Datei ausgesucht werden (Abb.2).
+
Durch das mittig platzierte Eingabefeld können Texte aus verschiedenen Quellen dem zu analysierenden Korpus hinzugefügt werden (Abb. 1). Dazu kann man entweder einen ganzen Volltext mithilfe von ''Copy and Paste'' in das Eingabefeld einfügen, oder gar, wenn es sich um einen online verfügbaren Text handelt, die URL des Onlinemediums in das Eingabefeld einspeisen und mit dem ''Reveal''-Button hochladen. Befindet sich die zu analysierende Textdatei auf der Festplatte des benutzten Computers, so kann mit der unter dem Eingabefeld befindlichen Upload-Funktion die Datei ausgesucht werden (Abb. 2).
  
Sollte man keinen Text zur Verfügung haben, gibt es die Möglichkeit, mit zwei bereits vorgefertigten Referenzkorpora zu arbeiten. Man kann dann zwischen den gesammelten Stücken Shakespeares oder den [http://de.wikipedia.org/wiki/Listserv Listserv] Archiven der geisteswissenschaftlichen Community von Hermeneuti.ca auswählen.  
+
Sollte man keinen Text zur Verfügung haben, gibt es die Möglichkeit, mit zwei bereits vorgefertigten Beispielkorpora zu arbeiten. Man kann dann zwischen den gesammelten Stücken Shakespeares oder den [http://de.wikipedia.org/wiki/Listserv Listserv] Archiven der geisteswissenschaftlichen Community von Hermeneuti.ca auswählen.  
[[Datei:VoyeurAnalyseInterface.jpg|left|thumb|Abb.3 Standard-Interface]]
+
[[Datei:VoyeurAnalyseInterface.jpg|left|thumb|Abb. 3 Standard-Interface]]
Der so geladene Korpus (Abb.3) wird auf einer standardisierten Benutzeroberfläche angezeigt, welche in verschiedene Segmente, sogenannte ''Panels'', eingeteilt ist. Eines davon ist der zentral gelegene ''Corpus Reader'', der den oder die geladenen Text-e anzeigt. Diese werden in gleich große Segmente unterteilt (gestrichelter Balken am linken Panelrand) und können durch Mausklick aufgerufen werden. Korpora, die aus mehreren Datensätzen bestehen, werden im Balken farbig dargestellt und können somit schnell unterschieden werden. Die jeweils starke oder schwache Färbung der einzelnen Segmente des Balkens gibt einen Hinweis auf die Häufigkeit ausgesuchter Schlagwörter (oder auch ''Keywords'') in dem jeweiligen Textausschnitt. Diese werden im ''Corpus Reader'' gelb markiert und kurz rot umrandet, wenn man diese mit Mausklick auswählt.
+
Das so geladene Korpus (Abb. 3) wird auf einer standardisierten Benutzeroberfläche angezeigt, welche in verschiedene Segmente, sogenannte ''Panels'', eingeteilt ist. Eines davon ist der zentral gelegene ''Corpus Reader'', der den oder die geladenen Text-e anzeigt. Diese werden in gleich große Segmente unterteilt (gestrichelter Balken am linken Panelrand) und können durch Mausklick aufgerufen werden. Korpora, die aus mehreren Datensätzen bestehen, werden im Balken farbig dargestellt und können somit schnell unterschieden werden. Die jeweils starke oder schwache Färbung der einzelnen Segmente des Balkens gibt einen Hinweis auf die Häufigkeit der durch den Anwender ausgesuchten Schlagwörter (oder auch ''Keywords'') in dem jeweiligen Textausschnitt. Diese Keywords werden im ''Corpus Reader'' gelb markiert und kurz rot umrandet, wenn man sie mit einem Mausklick auswählt.
  
 
Rechts und links werden Analyse- und Interpretationstools geladen, welche sich quantitativ mit dem Korpus auseinander setzen. Dazu gehören im linken Interface-Bereich  
 
Rechts und links werden Analyse- und Interpretationstools geladen, welche sich quantitativ mit dem Korpus auseinander setzen. Dazu gehören im linken Interface-Bereich  
*'''Cirrus''' (visualisiert die häufigsten Wortfrequenzen mit Hilfe der Darstellung dieser Wörter in einem zufälligen Arrangement. Die häufigsten Wörter werden dabei größer dargestellt und mittig platziert.),
+
*'''Cirrus''' visualisiert ähnlich einer ''Wordcloud'' die häufigsten Wortfrequenzen mit Hilfe der Darstellung dieser Wörter in einem zufälligen Arrangement. Die häufigsten Wörter werden dabei größer dargestellt und mittig platziert.
 
   
 
   
*'''Summary''' (bietet einen informativen Überblick über die prägnantesten Merkmale der geladenen Dokumenten, wie bspw. die gesamte Anzahl der Dokumente sowie die Anzahl der darin befindlichen Tokens und Types)
+
*'''Summary''' bietet einen informativen Überblick über die prägnantesten Merkmale der geladenen Dokumenten, wie bspw. die gesamte Anzahl der Dokumente sowie die Anzahl der darin befindlichen Tokens und Types  
 
und  
 
und  
*'''Words in the Entire Corpus''' (tabellarisiert die Wortfrequenzen und untersucht diese hinsichtlich statistischer Merkmale wie beispielsweise der Standardabweichung oder dem Z-Score. Hier besteht auch die Möglichkeit, eine ''StopList'' anzuwenden, um die gängigsten Wörter der Alltagssprache herauszufiltern. Die Suchfunktion im unteren Bereich des Panels erlaubt es mithilfe der Eingabe einzelner sowie mehrerer Wörter (mit Kommata voneinander getrennt) oder Satzteile  (von Anführungszeichen umrahmt) diese im ''Corpus Reader'' zu suchen und zu markieren.).
+
*'''Words in the Entire Corpus''' tabellarisiert die Wortfrequenzen und untersucht diese hinsichtlich statistischer Merkmale wie beispielsweise der Standardabweichung oder dem Z-Score. Hier besteht auch die Möglichkeit, eine ''StopList'' anzuwenden, um die gängigsten Wörter der Alltagssprache herauszufiltern. Die Suchfunktion im unteren Bereich des Panels erlaubt es mithilfe der Eingabe einzelner sowie mehrerer Wörter (mit Kommata voneinander getrennt) oder Satzteile  (von Anführungszeichen umrahmt) diese im ''Corpus Reader'' zu suchen und zu markieren.
  
 
Die rechten Panels unterteilen sich in
 
Die rechten Panels unterteilen sich in
  
*'''Word Trend''' (visualisiert grafisch die relative Frequenz eines ''Keywords'', verteilt auf die Segmente des Dokuments),  
+
*'''Word Trend''' visualisiert grafisch die relative Frequenz eines ''Keywords'', verteilt auf die Segmente des Dokuments),  
*'''Keyword in Context''' ( auch ''KWIC'', zeigt die Konkordanzen eines ''Keywords'' auf. Rechts und links vom Schlagwort wird ein Ausschnitt des Satzes angezeigt. Mithilfe der ''Preview''- und ''Context''-Buttons am unteren Abschnitt des Panels kann die Wortanzahl des Kontextabschnitts zwischen 5 und 500 Wörtern auf jeder Seite eingestellt werden.),
+
*'''Keyword in Context''' ( auch ''KWIC'', zeigt die Konkordanzen eines ''Keywords'' auf. Rechts und links vom Schlagwort wird ein Ausschnitt des Satzes angezeigt. Mithilfe der ''Preview''- und ''Context''-Buttons am unteren Abschnitt des Panels kann die Wortanzahl des Kontextabschnitts zwischen 5 und 500 Wörtern auf jeder Seite eingestellt werden.  
*'''Words in Documents''' (zeigt statistische Informationen, ähnlich dem ''Word in the Entire Corpus''-Panel, zum ausgewählten ''Keyword'' in allen geladenen Dokumenten des Korpus an).{{clr}}
+
*'''Words in Documents''' zeigt statistische Informationen, ähnlich dem ''Word in the Entire Corpus''-Panel, zum ausgewählten ''Keyword'' in allen geladenen Dokumenten des Korpus an.{{clr}}
  
[[Datei:Export.jpg|left|thumb|Abb.4 Exportmöglichkeiten]]
+
[[Datei:Export.jpg|left|thumb|Abb. 4 Exportmöglichkeiten]]
Jedes Panel verfügt in seiner Kopfleiste über eine Reihe an Funktionssymbolen: Mithilfe des Zahnrads kann man für jedes Panel Optionen einstellen, welche beispielsweise einen Wortfilter (die sogenannte ''StopList'' filtern die gängigsten Wörter der Alltagssprache) aktivieren oder den [http://en.wikipedia.org/wiki/Standard_score Z-score] einstellen. Ebenso verfügt jedes Panel über eine Hilfesymbolik, welche kurze  Erklärungen gibt sowie bei Bedarf den Nutzer auf die Projektseite hermeneuti.ca weiterleitet. Dort gibt es Tutorials, Videos und den sogenannten ''Quick Guide for Voyeur Users'', mit dessen Hilfe man seine ersten Schritte mit Voyant meistern kann.
+
Jedes Panel verfügt in seiner Kopfleiste über eine Reihe an Funktionssymbolen: Mithilfe des Zahnrads kann man für jedes Panel Optionen einstellen, welche beispielsweise einen Wortfilter (die sogenannte ''StopList'' filtern die gängigsten Wörter der Alltagssprache) aktivieren oder den [http://en.wikipedia.org/wiki/Standard_score Z-score] einstellen. Letzteres - unter dem Wert ''Difference'' zusammengefasst - wird benötigt, um die zufällige Streuung für die Analyse relevanter Wörter im Hauptkorpus zu ermitteln und gegebenfalls mit weiteren Teilkorpora vergleichen zu können. Zu den weiteren einstellbaren statistischen Werten gehören ''Peakedness'' (zeigt den Stellenwert extremer Abweichungen innerhalb der relativen Frequenz an), ''Std. Dev." oder auch Standardabweichung (zeigt die Streuung eines Wert vom Durchschnitt an) sowie ''Skew'' (zeigt asymmetrische Messwerte in der relativen Frequenz eines Keywords an). Ebenso verfügt jedes Panel über ein Hilfesymbol in Form eines Fragezeichens, welche kurze  Erklärungen gibt sowie bei Bedarf den Nutzer auf die Projektseite hermeneuti.ca weiterleitet. Dort gibt es Tutorials, Videos und den sogenannten ''Quick Guide for Voyeur Users'', mit dessen Hilfe man seine ersten Schritte mit Voyant meistern kann.
  
Die Datensicherung erfolgt über das Diskettensymbol, welches sich über jedem Panel befindet.  Es bieten daraufhin mehrere Möglichkeiten der Datensicherung an. Alle ermittelten Daten können entweder in Form einer URL oder zur Einbindung auf bspw. einem Internet-Blog als sogenanntes HTML-Snippet gesichert werden (Abb.4).  Die Sicherung bleibt, ebenso wie das temporäre Speichern der Daten während der Arbeitssitzung, nur für kurze Zeit erhalten. Unter Umständen können mit jedem Versionen-Update oder nach langer Nicht-Nutzung die URL- sowie HTML-Dateien, die vorwiegend auf externen Onlinemedien gesichert wurden, an Gültigkeit verlieren. Die Auswahl dieser Datensicherungen stützt sich auf den Wunsch der Entwickler, die Arbeit und Ergebnisse mit Voyant zu verbreiten. Es soll weiterhin ermöglicht werden, die Arbeiten anderer Benutzer bearbeiten und verbessern zu können, um letztlich den Umgang mit computerunterstützten Textanalysetools wie Voyant bekannter und beliebter zu machen. Ob sich diese Form der Datensicherung in den nächsten Versionen von Voyant verändern wird, ist abhängig von den Erfahrungsberichten der Tool-Benutzer sowie den Bug-Meldungen.{{clr}}
+
Die Datensicherung erfolgt über das Diskettensymbol, welches sich über jedem Panel befindet.  Es bieten daraufhin mehrere Möglichkeiten der Datensicherung an. Alle ermittelten Daten können entweder in Form einer URL oder zur Einbindung auf bspw. einem Internet-Blog als sogenanntes HTML-Snippet gesichert werden (Abb. 4).  Die Sicherung bleibt, ebenso wie das temporäre Speichern der Daten während der Arbeitssitzung, nur für kurze Zeit erhalten. Unter Umständen können mit jedem Versionen-Update oder nach langer Nicht-Nutzung die URL- sowie HTML-Dateien, die vorwiegend auf externen Onlinemedien gesichert wurden, an Gültigkeit verlieren. Die Auswahl dieser online aufrufbaren sowie schnell zu verbreitenden Datensicherungen stützt sich auf den Wunsch der Entwickler, die Arbeit und die Ergebnisse mit Voyant zu popularisieren. Es soll weiterhin ermöglicht werden, die Arbeiten anderer Anwender bearbeiten und verbessern zu können. Ob sich diese Form der Datensicherung in den nächsten Versionen von Voyant verändern wird, ist abhängig von den Erfahrungsberichten der Tool-Benutzer sowie den Bug-Meldungen.{{clr}}
  
 
==='''Der SkinBuilder'''===
 
==='''Der SkinBuilder'''===
Zeile 46: Zeile 54:
  
 
<gallery>
 
<gallery>
Image:bubblelines-square.png|<b>Bubblelines</b>Jedes Dokument wird als eine horizontale Linie, jeder Begriff als Blase dargestellt. Die Blasen zeigen die Wortfrequenz in den Segmenten des Dokuments an. Je größer die Blase, desto häufiger kommt der Begriff vor.
+
Image:bubblelines-square.png|<b>Bubblelines</b> stellt jedes Dokument als eine horizontale Linie, jeden Begriff als Blase dar. Die Blasen zeigen die Wortfrequenz in den Segmenten des Dokuments an. Je größer die Blase, desto häufiger kommt der Begriff vor.
Image:Bubbles thumb.png|<b>Bubbles</b><br>Dieses Tool zeigt mithilfe der Größe der Blasen die höchsten Wortfrequenzen in dem Dokument an.
+
Image:Bubbles thumb.png|<b>Bubbles</b><br> verdeutlicht mit der Darstellung der Größe der Blasen die höchsten Wortfrequenzen in dem Dokument.
Image:Cirrus thumb.png|<b>Cirrus</b><br>ist ein Visualisierungstool, welches die Häufigkeit von Wörter in einer sogenannten Word Cloud (engl. Für Wort Wolke) darstellt. Je größer ein Wort, desto häufiger wurde es innerhalb des Korpus gezählt. Mit einem Klick auf eines der Wörter erhält man detaillierte Informationen dazu.
+
Image:Cirrus thumb.png|<b>Cirrus</b><br>ist ein Visualisierungstool, welches die Häufigkeit von Wörter in einer sogenannten Word Cloud (engl. für Wortwolke) darstellt. Je größer ein Wort, desto häufiger wurde es innerhalb des Korpus gezählt. Mit einem Klick auf eines der Wörter kann man in Verbindung mit anderen Visualisierung- und Analsysetools (z.B. WordTrends oder Summary)detaillierte Informationen erhalten.
Image:Corpusgrid thumb.png|<b>Corpus Grid</b><br>zeigt eine tabellarische Übersicht über den Korpus an, inklusive den Titel der Dokumente, die Anzahl der Types und Tokens (Unique und Total Word) und die Wortschatzdichte ([http://de.wikipedia.org/wiki/Type-Token-Relation Type-Token-Relation]) an.
+
Image:Corpusgrid thumb.png|<b>Corpus Grid</b><br>zeigt eine tabellarische Übersicht über das Korpus an, inklusive des Titels der Dokumente, der Anzahl der Types und Tokens (Unique und Total Word)innerhalb des Dokuments oder der Dokumente, und der Wortschatzdichte ([http://de.wikipedia.org/wiki/Type-Token-Relation Type-Token-Relation]) an.
 
Image:Corpussummary thumb.png|<b>Corpus Summary</b><br>ist ein Tool, das einen grundinformativen Überblick über die Charakteristik der geladenen Dokumente gibt. Features dieses Tools zeigen die Wortanzahl, der Anzahl der Types und Tokens eines Textes, das längste Dokument und die höchste Wortschatzdichte an. Weiterhin gibt es die Möglichkeit, die häufigsten Wörter sowie besonders heraus stechende Wörter  anzeigen zu lassen.
 
Image:Corpussummary thumb.png|<b>Corpus Summary</b><br>ist ein Tool, das einen grundinformativen Überblick über die Charakteristik der geladenen Dokumente gibt. Features dieses Tools zeigen die Wortanzahl, der Anzahl der Types und Tokens eines Textes, das längste Dokument und die höchste Wortschatzdichte an. Weiterhin gibt es die Möglichkeit, die häufigsten Wörter sowie besonders heraus stechende Wörter  anzeigen zu lassen.
Image:Corpustermfrequencies thumb 0.png|<b>Corpus Term Frequencies</b><br>tabellarisiert die häufigsten Wortfrequenzen und gibt Informationen darüber, wie diese innerhalb der einzelnen Dokumente des Korpus verteilt sind.
+
Image:Corpustermfrequencies thumb 0.png|<b>Corpus Term Frequencies</b><br>tabellarisiert die häufigsten Wortfrequenzen und gibt statistische Informationen darüber, wie diese innerhalb der einzelnen Dokumente des Korpus verteilt sind.
 
Image:Documentkwics thumb.png|<b>Document KWICs</b><br>zeigt eine Tabelle an Schlagwörter, eingebettet in ihrem Kontext, an.
 
Image:Documentkwics thumb.png|<b>Document KWICs</b><br>zeigt eine Tabelle an Schlagwörter, eingebettet in ihrem Kontext, an.
Image:Documenttermfrequencies thumb.png|<b>Document Term Frequencies</b><br>zeigt die Frequenz eines Wortes für jedes Dokument des Korpus an.  Gelb unterlegte Schlagwörter werden in der Kopfzeile des Tool angezeigt und in der darunter liegenden Tabelle informativ exploriert.   
+
Image:Documenttermfrequencies thumb.png|<b>Document Term Frequencies</b><br>zeigt die Frequenz eines Wortes für jedes Dokument des Korpus an.  Gelb unterlegte Schlagwörter werden in der Kopfzeile des Tools angezeigt und in der darunter liegenden Tabelle hinsichtlich auswählbarer statistischen Informationen informativ exploriert.   
 
Image:Knots thumb.png|<b>Knots</b><br>ist ein Visualisierungstool, welches anzeigt, wie Begriffe eines Korpus miteinander verknüpft sind. Jeder Begriff wird als eine gekräuselte Linie dargestellt. Kommen verschiedene Linien zusammen oder überschneiden sich, so besteht eine untersuchenswerte Verknüpfung.
 
Image:Knots thumb.png|<b>Knots</b><br>ist ein Visualisierungstool, welches anzeigt, wie Begriffe eines Korpus miteinander verknüpft sind. Jeder Begriff wird als eine gekräuselte Linie dargestellt. Kommen verschiedene Linien zusammen oder überschneiden sich, so besteht eine untersuchenswerte Verknüpfung.
Image:Lava thumb.png|<b>Lava</b><br>erlaubt es den Korpus in einer 3-D-Grafik darzustellen. Ein Klick auf beliebige Dokumente des Korpus verändert die Lava-Visualisierung in einen weiter informierenden Ring. Dieser eröffnet zusätzliche Einblicke in den Kontext ausgesuchter Schlagwörter der Dokumente.
+
Image:Lava thumb.png|<b>Lava</b><br>erlaubt es das Korpus in einer 3-D-Grafik darzustellen. Ein Klick auf beliebige Dokumente des Korpus verändert die Lava-Visualisierung in einen weiter informierenden Ring. Dieser eröffnet zusätzliche Einblicke in den Kontext vom Anwender ausgesuchter Schlagwörter innerhalb der Dokumente.
Image:Links thumb.png|<b>Links</b><br>findet Kollokationen und zeigt diese in einer Mindmap ähnlichen Grafik an. Es zeigt die Häufigkeit von Begriffen in unmittelbarer Nähe zu einem gewünschten Schlagwort auf.
+
Image:Links thumb.png|<b>Links</b><br> (auch Collocate Cluster) findet Kollokationen und zeigt diese in einer Mindmap ähnlichen Grafik an. Es zeigt die Häufigkeit von Begriffen, welche innerhalb eines Satzes in ähnlichen grammatischen Stellungen zum gewünschten Schlagwort auftreten, an.
 
Image:Mandala thumb2.png|<b>Mandala</b><br>exportiert Textdateien, um eine Frequenz- und Verknüpfungsanalyse durchzuführen. Beispiel: Das Importieren eines dramatischen Stücks erlaubt die Verknüpfung und Frequenzanzeige eines Wortes mit seinem Sprecher.
 
Image:Mandala thumb2.png|<b>Mandala</b><br>exportiert Textdateien, um eine Frequenz- und Verknüpfungsanalyse durchzuführen. Beispiel: Das Importieren eines dramatischen Stücks erlaubt die Verknüpfung und Frequenzanzeige eines Wortes mit seinem Sprecher.
 
Image:Reader thumb.png|<b>Reader</b><br>zeigt den Text des Korpus an. Es ist weniger ein Analysetool als vielmehr eine Möglichkeit, den Inhalt des Korpus zu betrachten.
 
Image:Reader thumb.png|<b>Reader</b><br>zeigt den Text des Korpus an. Es ist weniger ein Analysetool als vielmehr eine Möglichkeit, den Inhalt des Korpus zu betrachten.
Image:Scatterplot thumb.png|<b>Scatterplot</b><br>erzeugt ein Streudiagramm der Wörter, welche voneinander  aufgrund ihrer Variation getrennt dargestellt werden.
+
Image:Scatterplot thumb.png|<b>Scatterplot</b><br>erzeugt ein Streudiagramm der Wörter, welches die absolute und die relative Frequenz vom Anwender ausgesuchter Keywords grafisch darstellt.  
 
Image:Termfountain thumb.png|<b>Term Frequencies Chart</b><br>zeigt die Verteilung von Begriffen innerhalb der Dokumente an (Die Dokumente werden in der Reihenfolge angezeigt, in der sie hinzugefügt wurden).
 
Image:Termfountain thumb.png|<b>Term Frequencies Chart</b><br>zeigt die Verteilung von Begriffen innerhalb der Dokumente an (Die Dokumente werden in der Reihenfolge angezeigt, in der sie hinzugefügt wurden).
 
Image:Typefrequencieschart thumb.png|<b>Term Fountain</b><br>visualisiert Wortfrequenzen als Fontänen.
 
Image:Typefrequencieschart thumb.png|<b>Term Fountain</b><br>visualisiert Wortfrequenzen als Fontänen.
Zeile 67: Zeile 75:
 
== '''Daten-Einspeisung''' ==
 
== '''Daten-Einspeisung''' ==
  
Nahezu alle gängigen Textdateiformate werden von Voyant erkannt und in die Analyselandschaft hochgeladen. Neben Word-, Text- und  PDF-Dateien ist somit auch die Einspeisung von Rich Text Formaten (.rtf), XML- oder HTML-Dateien möglich. Kleinere Datensätze, bestehend aus einzeln hoch geladenen Textdateien, werden innerhalb kurzer Zeit geladen. Um größere Mengen an Daten – mehrere Mega- bis zu Gigabyte – in Voyant zu laden, benötigt man allerdings eine recht hohe DSL-Bandbreite. Eine Vor-Annotation ist für die Verwendung mit Voyant nicht nötig, vor allem aber im Moment auch nicht anzuwenden. Jede Art von öffentlich zugänglichen Texten kann theoretisch geladen und untersucht werden. Eine händische Annotation des zu analysierenden Textes wird in der Regel nicht erkannt und als Teil des Korpus interpretiert.
+
Nahezu alle gängigen Textdateiformate werden von Voyant erkannt und in die Analyselandschaft hochgeladen. Neben Word-, Text- und  PDF-Dateien ist somit auch die Einspeisung von Rich Text Formaten (.rtf), XML- oder HTML-Dateien möglich. Kleinere Datensätze, bestehend aus einzeln hoch geladenen Textdateien, werden innerhalb kurzer Zeit geladen. Um größere Mengen an Daten – mehrere Mega- bis zu Gigabyte – in Voyant zu laden, benötigt man allerdings eine recht hohe DSL-Bandbreite. Eine Vor-Annotation ist für die Verwendung mit Voyant im Moment nicht möglich. Jede Art von öffentlich zugänglichen Texten kann theoretisch geladen und untersucht werden.
 
+
 
+
  
 
== '''Benutzerfreundlichkeit ''' ==
 
== '''Benutzerfreundlichkeit ''' ==
Voyant richtet sich an ein breites Spektrum an Nutzern. Das übersichtliche und schnell zugängliche Interface erleichtert jedem Neueinsteiger auf dem Gebiet der computergestützten Textanalyse den Zugang zu Voyant. Jedes Panel bietet neben einem Optionen- und Export-Button auch eine Hilfestellung an. Jedes einzelne Panel wird somit erklärt und kann separat erkundet werden. Bietet das Help-Button noch zu wenig Erklärung, kann ein Mausklick auf ''more'' getätigt werden, der den Benutzer auf die Entwicklungsseite weiterleitet. Dort können zu verschiedenen Bereichen rund um Voyant mithilfe von Video- und Text-Tutorials und sogenannte ''Recipes'' (Anwendungsbeispiele) eingesehen werden. Zudem erleichtert der eigens für Voyant vorliegende [http://hermeneuti.ca/voyeur/users Quick Guide]  die ersten Schritte mit dem Tool. Die Interpretation der erarbeiteten Daten dagegen erschließt sich aufgrund der hohen Dichte an statistischen Forschungsdaten bereits erfahrenen Nutzern weitaus leichter. Dennoch können auch Anfänger einfache Fragestellungen an ihrem literarischen Text mit Voyant erarbeiten.
+
Voyant richtet sich an ein breites Spektrum an Nutzern. Das übersichtliche und schnell zugängliche Interface erleichtert jedem Neueinsteiger auf dem Gebiet der computergestützten Textanalyse den Zugang zu Voyant. Jedes Panel bietet neben einem Optionen- und Export-Button auch eine Hilfestellung an. Jedes einzelne Panel wird somit erklärt und kann separat erkundet werden. Bietet der Help-Button noch zu wenig Erklärung, kann ein Mausklick auf ''more'' getätigt werden, der den Benutzer auf die Entwicklungsseite weiterleitet. Dort können zu verschiedenen Bereichen rund um Voyant mithilfe von Video- und Text-Tutorials und sogenannte ''Recipes'' (Anwendungsbeispiele) eingesehen werden. Zudem erleichtert der eigens für Voyant vorliegende [http://hermeneuti.ca/voyeur/users Quick Guide]  die ersten Schritte mit dem Tool. Die Interpretation der erarbeiteten Daten dagegen erschließt sich aufgrund der hohen Dichte an statistischen Forschungsdaten bereits erfahrenen Nutzern weitaus leichter. Dennoch können auch Anfänger einfache Fragestellungen an literarischen Texent mit Voyant erarbeiten.
  
 
== '''Transparenz''' ==
 
== '''Transparenz''' ==
  
Möchte man mithilfe von Voyant eigene Tools entwickeln, so kann man von Seiten der Hermeneuti.ca-Entwicklern Unterstützung erhalten. Besonders die Auswahl im Bereich des Datenexports zeigt den Wunsch der Entwickler an diejenigen Nutzer mit Programmierkenntnissen, mithilfe von Voyant eigene Projekte zu entwickeln(siehe Abb.4 Exportmöglichkeiten). Der Quellcode von Voyant darf und soll zu diesem Zweck benutzt werden. Eigens für Tool-Entwickler und Programmierer wurde ein [http://hermeneuti.ca/node/104 Manual] aufgesetzt, die den Nutzern die wichtigsten Herangehensweisen mit dem Tool näher bringt, ihnen genauere Details zu den Tools verrät sowie den Quellcode zugänglich macht. Hermeneuti.ca begrüßt das Interesse anderer Entwickler  mit dem Gedanken an die Verbesserungen an Voyant selbst, die durch eine intensive, externe Arbeit mit dem Quellcode einher geht. Dennoch betont man die Fehler und Bugs des unausgereiften Tools:
+
Möchte man mithilfe von Voyant eigene Tools entwickeln, so kann man von Seiten der Hermeneuti.ca-Entwicklern Unterstützung erhalten. Besonders die Auswahl im Bereich des Datenexports zeigt den Wunsch der Entwickler an diejenigen Nutzer mit Programmierkenntnissen, mithilfe von Voyant eigene Projekte zu entwickeln(siehe Abb.4 Exportmöglichkeiten). Der Quellcode von Voyant darf und soll zu diesem Zweck benutzt werden. Eigens für Tool-Entwickler und Programmierer wurde ein [http://hermeneuti.ca/node/104 Manual] aufgesetzt, die den Nutzern die wichtigsten Herangehensweisen mit dem Tool näher bringt, ihnen genauere Details zu den Tools verrät sowie den Quellcode zugänglich macht. Hermeneuti.ca begrüßt das Interesse anderer Entwickler  mit dem Gedanken an die Verbesserungen an Voyant selbst, die durch eine intensive, externe Arbeit mit dem Quellcode einher geht. Dennoch betont man die Fehler und Bugs des (noch) unausgereiften Tools:
  
 
„Voyeur is a work in progress – it is currently in beta. Some things don't work properly, some planned features aren't available yet. In particular, here are some weaknesses that we recognize:
 
„Voyeur is a work in progress – it is currently in beta. Some things don't work properly, some planned features aren't available yet. In particular, here are some weaknesses that we recognize:
Zeile 87: Zeile 93:
 
*multi-word (n-gram) views (though you can search for specific phrases)“ [http://hermeneuti.ca/voyeur]  
 
*multi-word (n-gram) views (though you can search for specific phrases)“ [http://hermeneuti.ca/voyeur]  
  
Die Arbeit an und mit Voyant ist, auch mithilfe und eben aufgrund der spezifische Möglichkeit der Datensicherung, an eine Veröffentlichung im Bereich der wissenschaftlichen Essays oder Internet-Blogs angepasst. Das Melden von Bugs sowie jegliche Art der konstruktiven Kritik sind explizit von der  Hermeneuti.ca-Community gewünscht. Diskussionen, Verbesserungen sowie Erweiterungen werden in der Hermeneuti.ca-Community auf ihrem [http://hermeneuti.ca/blog Blog] öffentlich besprochen.
+
Die Arbeit an und mit Voyant ist, auch mithilfe und eben aufgrund der spezifischen Möglichkeiten der Datensicherung, an eine Veröffentlichung im Bereich der wissenschaftlichen Essays oder Internet-Blogs angepasst. Das Melden von Bugs sowie jegliche Art der konstruktiven Kritik sind explizit von der  Hermeneuti.ca-Community gewünscht. Diskussionen, Verbesserungen sowie Erweiterungen werden in der Hermeneuti.ca-Community auf ihrem [http://hermeneuti.ca/blog Blog] öffentlich besprochen.
  
 
== '''Fazit''' ==
 
== '''Fazit''' ==
Mithilfe von Voyant lassen sich, ähnlich wie bei [http://litre.uni-goettingen.de/wiki/index.php/AntConc AntConc] und [http://litre.uni-goettingen.de/wiki/index.php/WMatrix Wmatrix], beliebig große Textkorpora quantitativ auf Konkordanz und Wortfrequenz untersuchen. Das Tool bietet durch eine große Zahl an Visualisierungsfeatures und die vor allem auf eine Veröffentlichung hinzielende Art der Datensicherung ein breites Spektrum an Möglichkeiten, die Arbeitsergebnisse mit und das Tool selbst anschaulich darzustellen und ausbauen zu können. Eine Zusammenarbeit mit dem Textanalyse-Tool [http://portal.tapor.ca/portal/portal ''TaPor''] ermöglicht zudem, die Ergebnisse aus beiden Tools in das jeweils andere zu exportieren. Das Interface ist einfach und übersichtlich gestaltet, eignet sich daher also ebenso für Anfänger auf dem Gebiet der computergestützten Korpuslinguistik, wie auch für Fortgeschrittene oder Programmentwickler.  Aufgrund der hohen Dichte an statistischen Fragestellungen, die man mithilfe einiger Optionen in den überwiegend tabellarischen Features einstellen und am Text prüfen lassen kann (beispielsweise den Z-score oder die Standardabweichung, etc), ist dagegen die Interpretation der gelieferten Ergebnisse für Neueinsteiger eher schwierig.
+
Mithilfe von Voyant lassen sich, ähnlich wie bei [http://litre.uni-goettingen.de/wiki/index.php/AntConc AntConc] und [http://litre.uni-goettingen.de/wiki/index.php/WMatrix Wmatrix], mehrere Megabyte große Textkorpora quantitativ auf beispielsweise Konkordanzen oder Wortfrequenzen untersuchen. Das Tool bietet durch eine große Zahl an Visualisierungsfeatures und die vor allem auf eine Veröffentlichung hinzielende Art der Datensicherung ein breites Spektrum an Möglichkeiten, die Arbeitsergebnisse mit dem und das Tool selbst anschaulich darzustellen und ausbauen zu können. Eine Zusammenarbeit mit dem Textanalyse-Tool [http://portal.tapor.ca/portal/portal ''TaPor''] ermöglicht zudem, die Ergebnisse aus beiden Tools in das jeweils andere zu exportieren und somit weitere Analyseformen ( z.B. part of speech, Lemmatisierung) anwenden zu können. Das Interface ist einfach und übersichtlich gestaltet, eignet sich daher also ebenso für Anfänger auf dem Gebiet der computergestützten Korpuslinguistik und Literaturwissenschaft, wie auch für Fortgeschrittene oder Programmentwickler.  Aufgrund der hohen Dichte an statistischen Analysewerten, die man mithilfe einiger Optionen in den überwiegend tabellarischen Features einstellen und am Text prüfen lassen kann (beispielsweise den Z-score oder die Standardabweichung, etc), ist dagegen die Interpretation der gelieferten Ergebnisse für Neueinsteiger eher schwierig.
  
Das Standard-Interface kann durch den sogenannten ''SkinBuilder'' individuelle verändert und der jeweiligen Forschungsfrage an das Tool angepasst werden. Diese Möglichkeit lässt sich in jeder beliebigen Arbeitsphase einstellen.
+
Das Standard-Interface kann durch den sogenannten ''SkinBuilder'' individuell verändert und an die jeweilige Forschungsfrage angepasst werden. Diese Möglichkeit lässt sich in jeder beliebigen Arbeitsphase einstellen.
Es ist nicht zwingend notwendig, bereits über digitale Texte oder über eine Forschungsfrage zu verfügen, um mit Voyant arbeiten zu können. OpenSource-Texte können ebenso unkompliziert per URL-Adresse oder als Volltext geladen werden, wie Dateien von der Festplatte oder das bereits vor gespeicherte Referenzkorpus der Entwicklergruppe. Zur Auswahl stehen dabei zwei Typen von literarischen Texten: Zum einen die gesammelten Stücke von Shakespeare, zum anderen ein Archiv der Email-Dialoge der geisteswissenschaftlichen Community von Hermeneuti.ca. Unabhängig von der Entscheidung, wie man seinen Korpus zusammenstellt und - bei Bedarf - unter welcher Frage man es untersucht, bleibt der Zeitaufwand gemessen an den Ergebnissen, die sich mithilfe von Voyant erzielen lassen, eher gering. Die Texte benötigen im Vorfeld keine Annotation, da Voyant vorwiegend quantitativ arbeitet.  
+
Es ist nicht zwingend notwendig, bereits über digitale Texte oder über hilfreiche Fragestellungen für die Analyse zu verfügen, um mit Voyant arbeiten zu können. OpenSource-Texte können ebenso unkompliziert per URL-Adresse oder als Volltext geladen werden, wie Dateien von der Festplatte oder das bereits vor gespeicherte Referenzkorpus der Entwicklergruppe. Zur Auswahl stehen dabei zwei Typen von literarischen Texten: Zum einen die gesammelten Stücke von Shakespeare, zum anderen ein Archiv der Email-Dialoge der geisteswissenschaftlichen Community von Hermeneuti.ca. Unabhängig von der Entscheidung, wie man sein Korpus zusammenstellt und - bei Bedarf - unter welcher Frage man es untersucht, bleibt der Zeitaufwand gemessen an den Ergebnissen, die sich mithilfe von Voyant erzielen lassen, eher gering. Die Arbeit mit Voyant verläuft vorwiegend quantitativ, eine Annotation ist (noch) nicht möglich.
  
Es empfiehlt sich, sich bei der Arbeit mit Voyant auf der Ebene von oberflächenstrukturellen Fragen zu bewegen, da diese in der Regel von dem Tool zuverlässig untersucht werden können. Obwohl Voyant auch in der Lage ist, Kollokationen aufzufinden, ist diese Funktion oftmals noch stark verbuggt. Diffizile Untersuchungsfelder wie Spannung und Ironie erfordern eine höhere Ebene der Analyse, die Voyant (noch) nicht leisten kann. Die zeitintensive Vorarbeit und die konzeptionelle Schärfe des Forschenden, die dazu nötig wären komplexere oder abstraktere Fragestellungen hinsichtlich der Semantik oder Grammatik eines Textes zu untersuchen, hätten jedoch den positiven Nebeneffekt, dass die entwickelten Ergebnisse nicht für selbstverständlich genommen werden. Im Moment bewirkt die enorme Menge an statistischen Daten, die Voyant liefert, leider genau das. Dennoch bietet Voyant den ersten Schritt in die richtige Richtung: Das effektive, methodologische Vorgehen Voyants, durch das sture Zählen von Wörtern in ein oder mehreren, bis zu einigen GB großen Datensätzen, leistet eine Arbeit, die händisch ein ausgesprochen Zeit intensives Projekt bedeuten würde. Die weitere Interpretationsphase, gemäß der Forschungsfrage, muss vom Forschenden übernommen werden. [http://www.digitalhumanities.org/companion/view?docId=blackwell/9781405103213/9781405103213.xml&chunk.id=ss1-2-8 Rommel] bemerkt dazu:
+
Es empfiehlt sich, sich bei der Arbeit mit Voyant auf der Ebene von oberflächenstrukturellen Fragen zu bewegen, da diese in der Regel von dem Tool zuverlässig untersucht werden können. Obwohl Voyant auch in der Lage ist, Kollokationen aufzufinden, ist diese Funktion allerdings oftmals noch stark verbuggt und kann häufig nicht zuverlässig benutzt werden. Diffizile Untersuchungsfelder wie Spannung und Ironie erfordern eine höhere Ebene der Analyse, die Voyant (noch) nicht leisten kann. Ebenso sind bei der Anwendung von Voyant im Moment noch keine Lemmatisierung sowie ein Part-of-speech-Tagging möglich, auch wenn diese Funktionen bereits geplant sind. Die zeitintensive Vorarbeit und die konzeptionelle Schärfe des Forschenden, die dazu nötig wären komplexere oder abstraktere Fragestellungen hinsichtlich der Semantik oder Grammatik eines Textes zu untersuchen, hätten jedoch den positiven Nebeneffekt, dass die entwickelten Ergebnisse einen höheren Grad der Analyse ermöglichten. Dennoch bietet Voyant den ersten Schritt in die richtige Richtung: Das effektive, methodologische Vorgehen Voyants, durch das sture Zählen von Wörtern in ein oder mehreren, bis zu einigen GB großen Datensätzen, leistet eine Arbeit, die händisch ein ausgesprochen Zeit intensives Projekt bedeuten würde. Die weitere Interpretationsphase, gemäß der Forschungsfrage, muss vom Forschenden übernommen werden. [http://www.digitalhumanities.org/companion/view?docId=blackwell/9781405103213/9781405103213.xml&chunk.id=ss1-2-8 Rommel] bemerkt zur Rolle von computergestützten Literaturanalyse sowie ihrer Interpretation folgendes:
"No immediate result,(...), can be obtained by the computer, but data are collected that allow for and require further analysis and interpretation by the researcher. The results, however, are impressive."
+
"By looking at the history of literary computing, [...] one cannot fail  to see that most contributions add significant insight in a very narrow spectrum of literary analysis - in the area of stylistic studies that focus an textual features. The input of computing in these studies is limited to the preparation and preparatory of the material under consideration. No immediate result, of course, can be obtained by the computer, but data are collected that allow for and require further analysis and interpretation by the researcher. The results, however, are impressive.Numerous studies of individual, and collections of, texts show that empirical ecidence can be used productively for literary analysis."
  
Voyant ist momentan als Beta-Version zugänglich; die weiteren, bereits jetzt auf dem Projekt-Blog Hermeneuti.ca's nachzulesenden Entwicklungsschritte lassen allerdings hoffen, in baldiger Zukunft auch semantische Analysen durchführen zu können. Wünschenswert wäre in dieser Hinsicht auch die Möglichkeit, eigene Stoplisten aufsetzen zu können sowie das Tool mithilfe von händischen Annotationen darauf zu trainieren, unwichtige Elemente im Korpus zu prüfen und bei Bedarf in einen separaten Unterordner herauszufiltern. Denn so nützlich und unkompliziert die Einspeisung von Daten aus einer URL auch sein mag, so resultiert daraus ein Korpus, der erstens mit Formatierungsschwierigkeiten arbeiten muss und dementsprechend langsamer als nötig geladen wird. Und zweitens wird jede Werbeeinblendung und jeder weiterführende Link als Teil des zu analysierenden Korpus behandelt. In dieser Hinsicht ist eine kritische Behandlung der präsentierten Daten unerlässlich.
+
Voyant ist momentan als Beta-Version zugänglich; die weiteren, bereits jetzt auf dem Projekt-Blog Hermeneuti.ca nachzulesenden Entwicklungsschritte lassen allerdings hoffen, in baldiger Zukunft auch semantische Analysen durchführen zu können. Wünschenswert wäre die Möglichkeit, eigene Stoplisten aufsetzen zu können sowie das Tool mithilfe von händischen Annotationen darauf zu trainieren, unwichtige Elemente im Korpus zu prüfen und bei Bedarf in einen separaten Unterordner herauszufiltern. Denn so nützlich und unkompliziert die Einspeisung von Daten aus einer URL auch sein mag, so resultiert daraus ein Korpus, der erstens mit Formatierungsschwierigkeiten arbeiten muss und dementsprechend langsamer als nötig geladen wird. Und zweitens wird jede Werbeeinblendung und jeder weiterführende Link als Teil des zu analysierenden Korpus behandelt. In dieser Hinsicht ist eine kritische Behandlung der präsentierten Daten unerlässlich.
  
 
== '''Beispielanwendung''' ==
 
== '''Beispielanwendung''' ==
  
Die Arbeit mit Voyant ist nicht an vordefinierte Forschungsfragen gebunden, kann aber aufgrund der hohen Menge der ermittelten Daten von Vorteil sein. Analysen literarischer Texten sollten daher vorwiegend auf Hypothesen gestützt werden, die sich mit dem quantitativ arbeitenden Voyant realisieren lassen oder die flexibel genug sind, unter Umständen angepasst zu werden.  
+
Die Arbeit mit Voyant ist nicht an vordefinierte Forschungsfragen gebunden. Aufgrund der hohen Menge an ermittelbaren Daten empfiehlt es sich vor allem für Anfänger, nicht ziellos an die Anwendung heranzutreten, da sonst die Interpretation erschwert wird. Analysen literarischer Texten sollten daher vorwiegend auf Hypothesen gestützt werden, die sich mit dem quantitativ arbeitenden Voyant realisieren lassen oder die flexibel genug sind, unter Umständen angepasst zu werden.  
  
 
[[Datei:Untersuchung1.png|right|thumb|Fig.5 Anwendungsbeispiel]]  
 
[[Datei:Untersuchung1.png|right|thumb|Fig.5 Anwendungsbeispiel]]  
Als Beispielanalyse wird die Frage nach den Frauenfiguren und ihrer Darstellungen in einigen ausgewählten Märchen der Gebrüder Grimm formuliert. Wie werden Frauen und Mädchen in Schneewittchen, Dornröschen sowie Hänsel und Grethel charakteristisch dargestellt? Welche Rollen erfüllen sie? Die Wahl der Texte wird aufgrund ihres Bekanntheitsgrades getroffen, benutzt wird jeweils die 7.Auflage (Ausgaben letzter Hand) aus dem Jahr 1857. Die digitale Fassung der drei Märchen wird [http://de.wikisource.org/wiki/Kinder-_und_Hausm%C3%A4rchen Wikisource] entnommen und als Text-Datei abgespeichert. Mit der Upload-Funktion von Voyant können die Texte daraufhin geladen werden. Um effektiver arbeiten zu können, bietet es sich an, mit dem Zahnrad-Button über dem ''Words in the Entire Corpus''-Panel eine deutschsprachige ''StopList'' zu aktivieren, um alle gängigen Wörter der Alltagssprache wie beispielsweise alle Relatoren etc. herauszufiltern. Die Tabelle ordnet nun die Frequenz der verbliebenen Wörter und zeigt diese in absteigender Reihenfolge an (Fig.5). Da das Interesse lediglich an den Frauen der Märchen besteht, markiert man nun händisch alle Schlagwörter weiblichen Geschlechts, die für die Prüfung der Hypothese hilfreich sein könnten, und erstellt sich durch das Hinzufügen dieser Auswahl eine Favoritenliste (Herzsymbol in der rechten Ecke des Panels).
+
Als Beispielanalyse wird die Frage nach den Frauenfiguren und ihrer Darstellungen in einigen ausgewählten Märchen der Gebrüder Grimm formuliert. Wie werden Frauen und Mädchen in Schneewittchen, Dornröschen sowie Hänsel und Grethel charakteristisch dargestellt? Welche Rollen erfüllen sie? Die Wahl der Texte wird aufgrund ihres Bekanntheitsgrades getroffen, benutzt wird jeweils die 7.Auflage (Ausgaben letzter Hand) aus dem Jahr 1857. Die digitale Fassung der drei Märchen wird [http://de.wikisource.org/wiki/Kinder-_und_Hausm%C3%A4rchen Wikisource] entnommen und als Text-Datei abgespeichert. Mit der Upload-Funktion von Voyant können die Texte daraufhin geladen werden. Für diese Beispielanwendung soll der Fokus auf dem Inhalt der Märchen, weniger auf dem Stil, liegen. Um effektiver für diese sogenannte Contentanalyse arbeiten zu können, bietet es sich an, mit dem Zahnrad-Button über dem ''Words in the Entire Corpus''-Panel eine deutschsprachige ''StopList'' zu aktivieren, um alle gängigen Wörter der Alltagssprache wie beispielsweise alle Relatoren etc. herauszufiltern. Die Tabelle ordnet nun die Frequenz der verbliebenen Wörter und zeigt diese in absteigender Reihenfolge an (Fig.5). Da das Interesse an den weiblichen Figuren der Märchen besteht, markiert man nun händisch alle relevant erscheinenden Schlagwörter weiblichen Geschlechts, die für die Prüfung der Hypothese hilfreich sein könnten, und erstellt sich durch das Hinzufügen dieser Auswahl eine Favoritenliste (Herzsymbol in der rechten Ecke des Panels). Zu den relevant erscheinenden Keywords gehören dabei neben Substantiven auch nach eigenem Ermessen als interessant erscheinende attributiv verwendete Adjektive, Adverbien, etc.
 
   
 
   
Die ''Word Trend'' Grafik zeigt daraufhin die Verteilung der Schlagwörter innerhalb der Segmente des Korpus an. Man erkennt auf den ersten Blick, dass Eigennamen wie Grethel nur innerhalb ihres Märchens gezählt werden, wohingegen die Bezeichnung „Alte“ durchweg in allen drei Texten verhältnismäßig ähnlich verteilt erscheint.
+
Die ''Word Trend'' Grafik zeigt daraufhin die Verteilung der Schlagwörter innerhalb der Segmente des Korpus an. Man erkennt auf den ersten Blick, dass Eigennamen wie Grethel nur innerhalb ihres jeweiligen Märchens auftreten, wohingegen die Bezeichnung „Alte“ durchweg in allen drei Texten verhältnismäßig ähnlich verteilt erscheint.
 +
 
 +
Dennoch ist Hänsel und Grethel der einzige Text, in dem parallel dazu die „Alte“ als Hexe näher beschrieben wird, während sie in den anderen beiden Märchen nicht als solche bezeichnet wird, sondern nur eine Interpretation ihrer Charakterisierung diesen Schluss zulässt. Diesen Hinweis erhält man, wenn man zu den Ergebnissen der Frequenzsuche den Kontext dank dem ''Keywords in Context''-Panel, kurz ''KWIC'', hinzuzieht.
 +
 
 +
Der Typus der alten Frau stellt in den ausgesuchten Märchen die wohl bekannteste Figur, nämlich die der Hexe, dar und ist in der Regel im Fortlauf der Handlung als solche anhand ihres Erscheinungsbildes identifizierbar. Die Favoritenliste aus dem Word in the Entire Corpus-Panel sollte im Laufe der Zusammenstellung aller weiblich konnotierten Schlagwörter daher „Alte“ und „Hexe“ beinhalten. Beide Wörter lassen sich durch Markierung der beiden HuG Fassungen im ''Words in Document''-Panel hervorheben und werden dadurch im ''KWIC'' exemplarisch angezeigt.
 +
In der Fassung von 1812 wird die Hexe als „Steinalte Frau“ mit wackelndem Kopf charakterisiert und einige Zeilen darauf direkt als Hexe bezeichnet. Die Hänsel und Grethel-Fassung von 1857 zeigt dagegen einige weitere Details im äußeren Erscheinungsbild der Hexe: Dort stützt sie sich beim Gehen auf einer Krücke, hat „rothe Augen“ und erhält durch einen Autorenkommentar eine „feine Witterung“. Zudem erlaubt die Untersuchung mithilfe des ''KWIC''-Panels das Erkennen der Hexe als kannibalistische Figur, welche den Wunsch hegt, die Kinder zu kochen und zu verspeisen. Trotz ihres Furcht einflösenden Äußeren gebärdet sich die alte Frau in der Erstfassung von 1812 recht arglos, als sie sich von Grethel in den Ofen schieben lässt. Die Fassung von 1857 zeigt im direkten Vergleich durch das ''KWIC'', dass diese Naivität durch die Autoren korrigiert wurde: Nun beugt sich die alte Frau in Ofenöffnung, um zu prüfen, ob dieser heiß genug ist.
 +
 
 +
Nicht jede zauberkundige Märchengestalt ist automatisch als Hexe zu betiteln, oftmals können auch andere Figurentypen ähnlich bedrohliche Funktionen übernehmen. Häufig kristallisiert sich daher die Stiefmutter als ebenso böse Kontrastfigur heraus. Die Art und Weise ihrer destruktiven Handlungen sind nicht unähnlich, dennoch gibt es große Unterschiede gegenüber der Hexenfigur festzustellen. In dem Märchen Schneewittchen lässt sich mithilfe des ''KWIC'' feststellen, dass noch in der Version von 1812 die leibliche Mutter die Rolle der bösen, hexenähnlichen Gestalt übernimmt, wohingegen 1857 diese bereits durch die Stiefmutter ausgetauscht wurde. Schneewittchens Stiefmutter wird direkt als schöne Frau bezeichnet, aber hegt großen Neid gegenüber anderen schönen Frauen. Anders als bei den Hexen gibt also das äußere Erscheinungsbild keinen Hinweis auf die innere Gesinnung, vielmehr sind es ihre bösartigen Handlungen und ihre Maskierungen, die Auskunft über ihren Typus als Gegenspielerin geben. Auch hier kann man dies über die Kontext-Funktion untersuchen. Auskunft über die Vielfalt der Rollen gibt die vermehrte Kostümierung der Stiefmutter als einerseits „alte Krämerin“, „altes Weib“ und als harmlos erscheinende „Bauersfrau“. Differenzierter ist es bei Dornröschen. Dort zeigt sich die „Alte“ als ein „altes Mütterchen“, welches Dornröschen an ihrem Geburtstag in einem verlassenen Turm vorfindet. Ob es sich bei der Alten um die dreizehnte weise Frau handelt, die im Vorfeld des Märchens Dornröschen mit einem Fluch belegte, kann nur spekuliert werden. Trotzdem führt diese Figur unweigerlich zur Erfüllung des bösen Fluchs und kann somit in die Reihe der hexenhaften Gestalten unter den Frauenfiguren aufgenommen werden. Der Vergleich der beiden Fassungen mithilfe des ''KWIC'' zeigt zuerst die Änderungen, die an dem Märchen vollzog. Waren es 1812 noch Feen, die zur Feier der Prinzesinnengeburt eingeladen worden sind, so sind es 1857 weise Frauen.
 +
 
 +
Um die Feen und weisen Frauen besser untersuchen zu können empfiehlt sich an dieser Stelle erneut, in dem ''Words in Documents''-Panel mit der Tastenkombination Shift und einem linken Mausklick die Dornröschen-Dokumente zu markieren und somit für das ''KWIC'' herauszufiltern. Die Figur der dreizehnten, weisen Frau gibt keinerlei Auskunft über ihr Aussehen oder wahres Alter. Die Rolle der alten Frau wird nur temporär angenommen, denn die Doppelbedeutung der alten Frau als einerseits einer mächtigen Gegenspielerin und andererseits einer harmlosen, vertrauenerweckenden Großmutter ermöglicht die dramatische Wendung, mit er das Märchen arbeitet.
 +
Innerhalb der Untersuchung prägnant erscheinender Schlagwörter wird deutlich, dass die Figur der weisen Frau gespalten ist: Einerseits obliegt ihr die Funktion der guten Patin, in der sie in helfender Funktion um das Wohl ihrer Schützlinge bemüht ist. Andererseits können auch in der Kategorie der weisen Frauen Einzelpersonen in der Funktion des Gegenspielers auftreten, die trotz ihrer zauberkundigen Fähigkeiten mit menschlichen Lastern behaftet sind. In Dornröschen ist dieser Umstand mithilfe des ''KWIC'' erkennbar, der das zornige und gekränkte Auftreten der dreizehnten weisen Frau verdeutlicht.  
  
Dennoch ist Hänsel und Grethel der einzige Text, in dem parallel dazu die „Alte“ als Hexe näher beschrieben wird. Diesen Hinweis erhält man, wenn man zu den Ergebnissen der Frequenzsuche den Kontext dank dem ''Keywords in Context''-Panel hinzuzieht.
+
In allen drei Texten verfügen die Frauen, die mehr oder minder in der Rolle der Heldin fungieren, über einen Eigennamen. Schneewittchen (im Text Sneewittchen) und Grethel werden 37 Mal gezählt, während Dornröschen nur acht Mal namentlich genannt wird. Das mag daran liegen, dass das Märchen mit ingesamt 1.226 Wörtern im Vergleich zu Hänsel und Grethel (2.690) und Schneewittchen (2.851) das kürzeste der dreien ist. Dornröschen und Schneewittchen zeigen allerdings allein schon durch ihre Namensgebung ihren hohen gesellschaftlichen Status an. Ihre Namen beschreiben gleichzeitig das prägnanteste Merkmal der Figur: Schneewittchens Schönheit wird anhand der Ästhetik von Blutstropfen im Schnee determiniert, wohingegen Dornröschen nach dem Rosenranken benannt ist, die sich wie ein Käfig um die schlafende Schönheit legen und diese dennoch umschmeicheln. Beide sind Königstöchter (6). Grethel dagegen stammt aus einer armen Familie. Die Attribute, die das Mädchen umgeben, sind oberflächlich und reichen von Schwesterchen (6) bis zu Mädchen (2). Es ist bis zuletzt nicht klar, dass auch Grethel eine heimliche Heldin darstellt, da sie doch vorwiegend durch ihren Bruder charakterisiert wird. Indem sie aber letztlich diesen und sich selbst aus den Fängen der Hexe befreit, in dem sie die alte Frau in den Ofen stößt, zeigt sie eine starke Seite an dem sonst weinerlich und unmündig beschriebenen Kind. Anders als Grethel, können Dornröschen und Schneewittchen als passive Heldinnen bezeichnet werden. Ihre „Errettung“ durch die Königssöhne (9 Mal gezählt) erfolgt auffällig zufällig. Die zukünftigen Ehegatten werden zudem schon bei der ersten Begegnung akzeptiert.
  
Mithilfe also des ''KWIC'' können die ausgesuchten Schlagwörter innerhalb ihres Kontext näher untersuchen werden. Die Ergebnisse lassen im Laufe der Analyse ein differenziertes Rollenbild der weiblichen Figuren erkennen: Die negativ besetzten Attribute („alt“, „böse“) der weiblichen Antagonisten  eröffnen mit einem Blick auf den Kontext ihrer Einbettung, dass mit verschiedenen Frauenfiguren gespielt wird, um das Vertrauen der Hauptcharaktere zu ergattern (gekränkte, weise Frau - altes Mütterchen; eitle, böse Stiefmutter - alte Krämerin).  Auf der anderen Seite sind die „Heldinnen“ der Märchen mit Namen versehen. Dornröschen (8 Mal gezählt) und ''Sneewittchen'' (37) erhalten ihre Beschreibung mithilfe ihrer Namensgebung und werden zudem als Königstöchter (6) charakterisiert. Allein dieser Umstand erlaubt, die beiden Frauen mit Eigenschaften zu versehen, die ihre Schönheit und Tugenden hervorheben (bspw. Sneewittchen: schönste (16)). Grethel (37) wird in den unteren Rängen der Gesellschaft angesiedelt: Ihre Familie ist arm und leidet Hunger. Durch ''KWIC'' wird sichtbar, dass es ihr Bruder ist, der sie überwiegend durch seine Anrede charakterisiert. Ihre Beschreibung ist an ihr Geschlecht und ihre Funktion innerhalb des Märchens geknüpft (Schwesterchen (6), Mädchen (2)). Aber auch hier wird durch den Vergleich aufgezeigt, dass nicht jede positive Frauenfigur die Rolle des Opfers übernimmt. Wohingegen Dornröschen und Schneewittchen ihren Schicksalen ausgeliefert auf Rettung durch Außerhalb entgegen schlafen, muss Grethel, die einzige mit einem tatsächlichen Namen im Gegenzug, um ihr eigenes Leben und das ihres Bruders zu retten, gegen die Hexe vorgehen. Sie überwindet ihre Rolle des unmündigen, schwachen Mädchens mit dem Todesstoß, den sie der Hexe in den Ofen erteilt. Die positiv vorgestellten Frauen agieren also aufgrund ihrer verschiedenen gesellschaftlichen Positionen unterschiedlich in Problemsituationen.
+
Mithilfe also des ''KWIC'' können die ausgesuchten Schlagwörter innerhalb ihres Kontext näher untersuchen werden. Die Ergebnisse lassen im Laufe der Analyse ein differenziertes Rollenbild der weiblichen Figuren erkennen: Die negativ besetzten Attribute („alt“, „böse“) der weiblichen Antagonisten  eröffnen mit einem Blick auf den Kontext ihrer Einbettung, dass mit verschiedenen Frauenfiguren gespielt wird, um das Vertrauen der Hauptcharaktere zu ergattern (gekränkte, weise Frau - altes Mütterchen; eitle, böse Stiefmutter - alte Krämerin).  Auf der anderen Seite sind die „Heldinnen“ der Märchen mit Namen versehen. Dornröschen (8 Mal gezählt) und ''Sneewittchen'' (37) erhalten ihre Beschreibung mithilfe ihrer Namensgebung und werden zudem als Königstöchter (6) charakterisiert. Allein dieser Umstand erlaubt, die beiden Frauen mit Eigenschaften zu versehen, die ihre Schönheit und Tugenden hervorheben (bspw. Sneewittchen: schönste (16)). Grethel (37) wird in den unteren Rängen der Gesellschaft angesiedelt: Ihre Familie ist arm und leidet Hunger. Durch ''KWIC'' wird sichtbar, dass es ihr Bruder ist, der sie überwiegend durch seine Anrede charakterisiert. Ihre Beschreibung ist an ihr Geschlecht und ihre Funktion innerhalb des Märchens geknüpft (Schwesterchen (6), Mädchen (2)). Aber auch hier wird durch den Vergleich aufgezeigt, dass nicht jede positive Frauenfigur die Rolle des Opfers übernimmt. Wohingegen Dornröschen und Schneewittchen ihren Schicksalen ausgeliefert auf Rettung "von außen" entgegen schlafen, muss Grethel, die einzige mit einem tatsächlichen Namen, um ihr eigenes Leben und das ihres Bruders zu retten, gegen die Hexe vorgehen. Sie überwindet ihre Rolle des unmündigen, schwachen Mädchens mit dem Todesstoß, den sie der Hexe in den Ofen erteilt. Die positiv vorgestellten Frauen agieren also aufgrund ihrer verschiedenen gesellschaftlichen Positionen unterschiedlich in Problemsituationen.
  
Es zeigt sich also, dass die untersuchten Frauenfiguren bestimmte, zum Teil auch vielfältige Rollenbilder gemäß ihrer Funktion innerhalb des Märchens übernehmen. Die Analyse solcher Ergebnisse erfordert, dass der Benutzer des Tools entweder im Vorfeld oder spätestens während der Analyse mithilfe des ''Corpus Readers'' dem Inhalt der Texte mehr Aufmerksamkeit schenkt. Die bloßen Ausgabendaten, die Voyant liefert, reichen nicht aus, um eine semantische Interpretation der kontextuellen Beziehungen der Schlagwörter zu den Figuren durchzuführen. Dennoch erleichtern die gängigen Analysetools des Standard-Interfaces die Arbeit um einiges: die Frequenzanalyse und die Konkordanzanzeige verkürzen die Arbeitsschritte und bieten dadurch an, im nächsten Schritt der Interpretation den Daten vor allem auf statistischer, aber auch auf semantischer Ebene mehr Aufmerksamkeit schenken zu können.
+
Es zeigt sich also, dass die untersuchten Frauenfiguren bestimmte, zum Teil auch vielfältige Rollenbilder gemäß ihrer Funktion innerhalb des Märchens übernehmen. Für die Analyse solcher Ergebnisse empfiehlt es sich, im Vorfeld oder spätestens während der Analyse mithilfe des ''Corpus Readers'' die Einbettung der ausgesuchten Keywords im Kontext stärker zu beleuchten.
 +
Tatsächlich erfordert eine solche Analyse ein hohes Maß an manueller Eigenleistung. Aber mithilfe des ''KWIC''-Panels wird die Untersuchung der gelieferten bzw. händisch ausgesuchten Keywords bequem vereinfacht, da diese einen erweiterbaren Blick auf das gesamte Korpus ermöglichen. Die Ausgabendaten, die Voyant liefert, reichen aber nicht aus, um eine semantische Interpretation der kontextuellen Beziehungen der Schlagwörter zu den Figuren durchzuführen. Dennoch erleichtern die gängigen Analysetools des Standard-Interfaces die Arbeit um einiges: die Frequenzanalyse und die Konkordanzanzeige verkürzen die Arbeitsschritte und bieten dadurch an, im nächsten Schritt der Analyse den Daten auf statistischer Ebene mehr Aufmerksamkeit schenken zu können.
  
 
== '''Literatur''' ==
 
== '''Literatur''' ==

Aktuelle Version vom 18. Oktober 2017, 16:35 Uhr

Unser LitRe-Wiki ist seit 2012 nicht eingreifend überarbeitet worden. Es bildet also den damaligen Stand ab. Um Weiterentwicklungen der digitalen Textanalyse abzubilden, sollen nun die Artikel peu à peu überarbeitet werden, und weitere Artikel hinzukommen.

Interesse? Haben Sie Lust, einen Artikel zu überarbeiten oder neu zu verfassen? Schreiben Sie uns! Auch Kommentare, Kritik oder Fragen sind willkommen: mailto:bherrma1@gwdg.de


Voyant (frz. für sehend, auffallend. Bis zum 19.0ktober 2011 unter dem Namen Voyeur bekannt) ist ein webbasiertes, englischsprachiges Tool zur computergestützten Analyse digitaler Texte. Es ist Teil des unter dem Namen Hermeneuti.ca - The Rhetoric of Text Analysis laufenden, kollaborativen Projekts der Kanadier Stefan Sinclair (McGill University ) und Geoffrey Rockwell (University of Alberta). Das Ziel der seit 2008 bestehenden Projektgruppe ist es, die Anwendung in der computergestützten Korpusanalyse zu theoretisieren, sowie die dazu verwendeten Tools und Programme zu entwickeln und auszubauen.[1] Voyant offeriert in seiner übersichtlichen Analyselandschaft eine relativ große Bandbreite an kleineren Tools zur Untersuchung literarischer Texte sowie zur Visualisierung der Ergebnisse. Zudem ist die Nutzung von Voyant kompatible zu anderen Analysetools, wie beispielweise TaPor. Die Projektgruppe bietet fortgeschrittenen Anwendern die Möglichkeit, mithilfe von Voyant eigene Tools zu einzubinden oder zu entwickeln. Im Moment ist das Tool unter drei URLs zu erreichen: http://www.voyant-tools.org, http://voyeur.hermeneuti.ca und http://voyeurtools.org.

Allgemeine Voraussetzungen

Um mit dem webbasierten Tool Voyant arbeiten zu können, benötigt man in erster Linie einen Computer mit Internetanschluss. Programmiert wurde es mit Java, weshalb eine Vorinstallation Javas vor der ersten Benutzung Voyants zu empfehlen ist. Abgesehen davon sind keine weiteren technischen Voraussetzungen nötig: Voyant kann mit verschiedenen Browsern wie z.B. Firefox, Internet Explorer, Google Chrome oder Safari geöffnet werden. Das kostenlose Tool befindet sich zur Zeit in der Beta-Version 1.0, eine Registrierung auf hermeneuti.ca ist nicht notwendig. Die Ergebnisse, die man im Laufe seiner Arbeit mit Voyant sammelt, können über verschiedene Exportmöglichkeiten wie zum Beispiel

  • als HTML-Quellcode, den man in externe Seiten einbinden kann
  • als fertig generierte URL
  • als bibliographische Zitation

oder

  • als tabellarisierte oder rohe Datensätze

gesichert werden. Die Ausgabe dieser Sicherungsmöglichkeiten erfolgt über .xml-, .html- oder reine Text-Dateien.

Detaillierte Beschreibung des Tools

Das Standard-Interface

Abb. 1 Startseite
Unter Aufrufen einer der drei möglichen URLs http://www.voyant-tools.org, http://www.voyeur.hermeneuti.ca oder http://www.voyeurtools.org wird der Benutzer auf die Startseite des Tools geleitet.
Abb. 2 Texteinspeisung

Durch das mittig platzierte Eingabefeld können Texte aus verschiedenen Quellen dem zu analysierenden Korpus hinzugefügt werden (Abb. 1). Dazu kann man entweder einen ganzen Volltext mithilfe von Copy and Paste in das Eingabefeld einfügen, oder gar, wenn es sich um einen online verfügbaren Text handelt, die URL des Onlinemediums in das Eingabefeld einspeisen und mit dem Reveal-Button hochladen. Befindet sich die zu analysierende Textdatei auf der Festplatte des benutzten Computers, so kann mit der unter dem Eingabefeld befindlichen Upload-Funktion die Datei ausgesucht werden (Abb. 2).

Sollte man keinen Text zur Verfügung haben, gibt es die Möglichkeit, mit zwei bereits vorgefertigten Beispielkorpora zu arbeiten. Man kann dann zwischen den gesammelten Stücken Shakespeares oder den Listserv Archiven der geisteswissenschaftlichen Community von Hermeneuti.ca auswählen.

Abb. 3 Standard-Interface

Das so geladene Korpus (Abb. 3) wird auf einer standardisierten Benutzeroberfläche angezeigt, welche in verschiedene Segmente, sogenannte Panels, eingeteilt ist. Eines davon ist der zentral gelegene Corpus Reader, der den oder die geladenen Text-e anzeigt. Diese werden in gleich große Segmente unterteilt (gestrichelter Balken am linken Panelrand) und können durch Mausklick aufgerufen werden. Korpora, die aus mehreren Datensätzen bestehen, werden im Balken farbig dargestellt und können somit schnell unterschieden werden. Die jeweils starke oder schwache Färbung der einzelnen Segmente des Balkens gibt einen Hinweis auf die Häufigkeit der durch den Anwender ausgesuchten Schlagwörter (oder auch Keywords) in dem jeweiligen Textausschnitt. Diese Keywords werden im Corpus Reader gelb markiert und kurz rot umrandet, wenn man sie mit einem Mausklick auswählt.

Rechts und links werden Analyse- und Interpretationstools geladen, welche sich quantitativ mit dem Korpus auseinander setzen. Dazu gehören im linken Interface-Bereich

  • Cirrus visualisiert ähnlich einer Wordcloud die häufigsten Wortfrequenzen mit Hilfe der Darstellung dieser Wörter in einem zufälligen Arrangement. Die häufigsten Wörter werden dabei größer dargestellt und mittig platziert.
  • Summary bietet einen informativen Überblick über die prägnantesten Merkmale der geladenen Dokumenten, wie bspw. die gesamte Anzahl der Dokumente sowie die Anzahl der darin befindlichen Tokens und Types

und

  • Words in the Entire Corpus tabellarisiert die Wortfrequenzen und untersucht diese hinsichtlich statistischer Merkmale wie beispielsweise der Standardabweichung oder dem Z-Score. Hier besteht auch die Möglichkeit, eine StopList anzuwenden, um die gängigsten Wörter der Alltagssprache herauszufiltern. Die Suchfunktion im unteren Bereich des Panels erlaubt es mithilfe der Eingabe einzelner sowie mehrerer Wörter (mit Kommata voneinander getrennt) oder Satzteile (von Anführungszeichen umrahmt) diese im Corpus Reader zu suchen und zu markieren.

Die rechten Panels unterteilen sich in

  • Word Trend visualisiert grafisch die relative Frequenz eines Keywords, verteilt auf die Segmente des Dokuments),
  • Keyword in Context ( auch KWIC, zeigt die Konkordanzen eines Keywords auf. Rechts und links vom Schlagwort wird ein Ausschnitt des Satzes angezeigt. Mithilfe der Preview- und Context-Buttons am unteren Abschnitt des Panels kann die Wortanzahl des Kontextabschnitts zwischen 5 und 500 Wörtern auf jeder Seite eingestellt werden.
  • Words in Documents zeigt statistische Informationen, ähnlich dem Word in the Entire Corpus-Panel, zum ausgewählten Keyword in allen geladenen Dokumenten des Korpus an.
Abb. 4 Exportmöglichkeiten

Jedes Panel verfügt in seiner Kopfleiste über eine Reihe an Funktionssymbolen: Mithilfe des Zahnrads kann man für jedes Panel Optionen einstellen, welche beispielsweise einen Wortfilter (die sogenannte StopList filtern die gängigsten Wörter der Alltagssprache) aktivieren oder den Z-score einstellen. Letzteres - unter dem Wert Difference zusammengefasst - wird benötigt, um die zufällige Streuung für die Analyse relevanter Wörter im Hauptkorpus zu ermitteln und gegebenfalls mit weiteren Teilkorpora vergleichen zu können. Zu den weiteren einstellbaren statistischen Werten gehören Peakedness (zeigt den Stellenwert extremer Abweichungen innerhalb der relativen Frequenz an), Std. Dev." oder auch Standardabweichung (zeigt die Streuung eines Wert vom Durchschnitt an) sowie Skew (zeigt asymmetrische Messwerte in der relativen Frequenz eines Keywords an). Ebenso verfügt jedes Panel über ein Hilfesymbol in Form eines Fragezeichens, welche kurze Erklärungen gibt sowie bei Bedarf den Nutzer auf die Projektseite hermeneuti.ca weiterleitet. Dort gibt es Tutorials, Videos und den sogenannten Quick Guide for Voyeur Users, mit dessen Hilfe man seine ersten Schritte mit Voyant meistern kann.

Die Datensicherung erfolgt über das Diskettensymbol, welches sich über jedem Panel befindet. Es bieten daraufhin mehrere Möglichkeiten der Datensicherung an. Alle ermittelten Daten können entweder in Form einer URL oder zur Einbindung auf bspw. einem Internet-Blog als sogenanntes HTML-Snippet gesichert werden (Abb. 4). Die Sicherung bleibt, ebenso wie das temporäre Speichern der Daten während der Arbeitssitzung, nur für kurze Zeit erhalten. Unter Umständen können mit jedem Versionen-Update oder nach langer Nicht-Nutzung die URL- sowie HTML-Dateien, die vorwiegend auf externen Onlinemedien gesichert wurden, an Gültigkeit verlieren. Die Auswahl dieser online aufrufbaren sowie schnell zu verbreitenden Datensicherungen stützt sich auf den Wunsch der Entwickler, die Arbeit und die Ergebnisse mit Voyant zu popularisieren. Es soll weiterhin ermöglicht werden, die Arbeiten anderer Anwender bearbeiten und verbessern zu können. Ob sich diese Form der Datensicherung in den nächsten Versionen von Voyant verändern wird, ist abhängig von den Erfahrungsberichten der Tool-Benutzer sowie den Bug-Meldungen.

Der SkinBuilder

Mithilfe des Export-Buttons in der obersten blauen Kopfleiste des Interfaces kann auf Wunsch der Nutzer auf den sogenannten SkinBuilder von Voyant weitergeleitet werden. Diese Funktion ermöglicht es, sich eine individuelle Benutzeroberfläche aus der Auswahl an Tools zusammen zu stellen, die Voyant zur Analyse von Texten anbietet. Die zum größten Teil aus Visualisierungstools bestehenden Ergänzungen können in vorher definierte Interface-Raster gezogen oder durch Doppelklick eingefügt werden. Alle zur Auswahl stehenden Features werden im Folgendem aufgelistet und kurz erklärt.

Detailliertere Informationen zu den Visualierungsfeatures findet man auf http://hermeneuti.ca/voyeur/tools.

Daten-Einspeisung

Nahezu alle gängigen Textdateiformate werden von Voyant erkannt und in die Analyselandschaft hochgeladen. Neben Word-, Text- und PDF-Dateien ist somit auch die Einspeisung von Rich Text Formaten (.rtf), XML- oder HTML-Dateien möglich. Kleinere Datensätze, bestehend aus einzeln hoch geladenen Textdateien, werden innerhalb kurzer Zeit geladen. Um größere Mengen an Daten – mehrere Mega- bis zu Gigabyte – in Voyant zu laden, benötigt man allerdings eine recht hohe DSL-Bandbreite. Eine Vor-Annotation ist für die Verwendung mit Voyant im Moment nicht möglich. Jede Art von öffentlich zugänglichen Texten kann theoretisch geladen und untersucht werden.

Benutzerfreundlichkeit

Voyant richtet sich an ein breites Spektrum an Nutzern. Das übersichtliche und schnell zugängliche Interface erleichtert jedem Neueinsteiger auf dem Gebiet der computergestützten Textanalyse den Zugang zu Voyant. Jedes Panel bietet neben einem Optionen- und Export-Button auch eine Hilfestellung an. Jedes einzelne Panel wird somit erklärt und kann separat erkundet werden. Bietet der Help-Button noch zu wenig Erklärung, kann ein Mausklick auf more getätigt werden, der den Benutzer auf die Entwicklungsseite weiterleitet. Dort können zu verschiedenen Bereichen rund um Voyant mithilfe von Video- und Text-Tutorials und sogenannte Recipes (Anwendungsbeispiele) eingesehen werden. Zudem erleichtert der eigens für Voyant vorliegende Quick Guide die ersten Schritte mit dem Tool. Die Interpretation der erarbeiteten Daten dagegen erschließt sich aufgrund der hohen Dichte an statistischen Forschungsdaten bereits erfahrenen Nutzern weitaus leichter. Dennoch können auch Anfänger einfache Fragestellungen an literarischen Texent mit Voyant erarbeiten.

Transparenz

Möchte man mithilfe von Voyant eigene Tools entwickeln, so kann man von Seiten der Hermeneuti.ca-Entwicklern Unterstützung erhalten. Besonders die Auswahl im Bereich des Datenexports zeigt den Wunsch der Entwickler an diejenigen Nutzer mit Programmierkenntnissen, mithilfe von Voyant eigene Projekte zu entwickeln(siehe Abb.4 Exportmöglichkeiten). Der Quellcode von Voyant darf und soll zu diesem Zweck benutzt werden. Eigens für Tool-Entwickler und Programmierer wurde ein Manual aufgesetzt, die den Nutzern die wichtigsten Herangehensweisen mit dem Tool näher bringt, ihnen genauere Details zu den Tools verrät sowie den Quellcode zugänglich macht. Hermeneuti.ca begrüßt das Interesse anderer Entwickler mit dem Gedanken an die Verbesserungen an Voyant selbst, die durch eine intensive, externe Arbeit mit dem Quellcode einher geht. Dennoch betont man die Fehler und Bugs des (noch) unausgereiften Tools:

„Voyeur is a work in progress – it is currently in beta. Some things don't work properly, some planned features aren't available yet. In particular, here are some weaknesses that we recognize:

  • lack of more advanced linguistic processing (lemmatization, parts of speech, semantic awareness)
  • lack of XML-aware analytic features (though XML is a valid input format)
  • the current default skin (configuration of tools) is not well-suited to reading texts
  • some of the user documentation is a bit bare
  • other funcitonality:
  • proximity searching of terms
  • multi-word (n-gram) views (though you can search for specific phrases)“ [2]

Die Arbeit an und mit Voyant ist, auch mithilfe und eben aufgrund der spezifischen Möglichkeiten der Datensicherung, an eine Veröffentlichung im Bereich der wissenschaftlichen Essays oder Internet-Blogs angepasst. Das Melden von Bugs sowie jegliche Art der konstruktiven Kritik sind explizit von der Hermeneuti.ca-Community gewünscht. Diskussionen, Verbesserungen sowie Erweiterungen werden in der Hermeneuti.ca-Community auf ihrem Blog öffentlich besprochen.

Fazit

Mithilfe von Voyant lassen sich, ähnlich wie bei AntConc und Wmatrix, mehrere Megabyte große Textkorpora quantitativ auf beispielsweise Konkordanzen oder Wortfrequenzen untersuchen. Das Tool bietet durch eine große Zahl an Visualisierungsfeatures und die vor allem auf eine Veröffentlichung hinzielende Art der Datensicherung ein breites Spektrum an Möglichkeiten, die Arbeitsergebnisse mit dem und das Tool selbst anschaulich darzustellen und ausbauen zu können. Eine Zusammenarbeit mit dem Textanalyse-Tool TaPor ermöglicht zudem, die Ergebnisse aus beiden Tools in das jeweils andere zu exportieren und somit weitere Analyseformen ( z.B. part of speech, Lemmatisierung) anwenden zu können. Das Interface ist einfach und übersichtlich gestaltet, eignet sich daher also ebenso für Anfänger auf dem Gebiet der computergestützten Korpuslinguistik und Literaturwissenschaft, wie auch für Fortgeschrittene oder Programmentwickler. Aufgrund der hohen Dichte an statistischen Analysewerten, die man mithilfe einiger Optionen in den überwiegend tabellarischen Features einstellen und am Text prüfen lassen kann (beispielsweise den Z-score oder die Standardabweichung, etc), ist dagegen die Interpretation der gelieferten Ergebnisse für Neueinsteiger eher schwierig.

Das Standard-Interface kann durch den sogenannten SkinBuilder individuell verändert und an die jeweilige Forschungsfrage angepasst werden. Diese Möglichkeit lässt sich in jeder beliebigen Arbeitsphase einstellen. Es ist nicht zwingend notwendig, bereits über digitale Texte oder über hilfreiche Fragestellungen für die Analyse zu verfügen, um mit Voyant arbeiten zu können. OpenSource-Texte können ebenso unkompliziert per URL-Adresse oder als Volltext geladen werden, wie Dateien von der Festplatte oder das bereits vor gespeicherte Referenzkorpus der Entwicklergruppe. Zur Auswahl stehen dabei zwei Typen von literarischen Texten: Zum einen die gesammelten Stücke von Shakespeare, zum anderen ein Archiv der Email-Dialoge der geisteswissenschaftlichen Community von Hermeneuti.ca. Unabhängig von der Entscheidung, wie man sein Korpus zusammenstellt und - bei Bedarf - unter welcher Frage man es untersucht, bleibt der Zeitaufwand gemessen an den Ergebnissen, die sich mithilfe von Voyant erzielen lassen, eher gering. Die Arbeit mit Voyant verläuft vorwiegend quantitativ, eine Annotation ist (noch) nicht möglich.

Es empfiehlt sich, sich bei der Arbeit mit Voyant auf der Ebene von oberflächenstrukturellen Fragen zu bewegen, da diese in der Regel von dem Tool zuverlässig untersucht werden können. Obwohl Voyant auch in der Lage ist, Kollokationen aufzufinden, ist diese Funktion allerdings oftmals noch stark verbuggt und kann häufig nicht zuverlässig benutzt werden. Diffizile Untersuchungsfelder wie Spannung und Ironie erfordern eine höhere Ebene der Analyse, die Voyant (noch) nicht leisten kann. Ebenso sind bei der Anwendung von Voyant im Moment noch keine Lemmatisierung sowie ein Part-of-speech-Tagging möglich, auch wenn diese Funktionen bereits geplant sind. Die zeitintensive Vorarbeit und die konzeptionelle Schärfe des Forschenden, die dazu nötig wären komplexere oder abstraktere Fragestellungen hinsichtlich der Semantik oder Grammatik eines Textes zu untersuchen, hätten jedoch den positiven Nebeneffekt, dass die entwickelten Ergebnisse einen höheren Grad der Analyse ermöglichten. Dennoch bietet Voyant den ersten Schritt in die richtige Richtung: Das effektive, methodologische Vorgehen Voyants, durch das sture Zählen von Wörtern in ein oder mehreren, bis zu einigen GB großen Datensätzen, leistet eine Arbeit, die händisch ein ausgesprochen Zeit intensives Projekt bedeuten würde. Die weitere Interpretationsphase, gemäß der Forschungsfrage, muss vom Forschenden übernommen werden. Rommel bemerkt zur Rolle von computergestützten Literaturanalyse sowie ihrer Interpretation folgendes: "By looking at the history of literary computing, [...] one cannot fail to see that most contributions add significant insight in a very narrow spectrum of literary analysis - in the area of stylistic studies that focus an textual features. The input of computing in these studies is limited to the preparation and preparatory of the material under consideration. No immediate result, of course, can be obtained by the computer, but data are collected that allow for and require further analysis and interpretation by the researcher. The results, however, are impressive.Numerous studies of individual, and collections of, texts show that empirical ecidence can be used productively for literary analysis."

Voyant ist momentan als Beta-Version zugänglich; die weiteren, bereits jetzt auf dem Projekt-Blog Hermeneuti.ca nachzulesenden Entwicklungsschritte lassen allerdings hoffen, in baldiger Zukunft auch semantische Analysen durchführen zu können. Wünschenswert wäre die Möglichkeit, eigene Stoplisten aufsetzen zu können sowie das Tool mithilfe von händischen Annotationen darauf zu trainieren, unwichtige Elemente im Korpus zu prüfen und bei Bedarf in einen separaten Unterordner herauszufiltern. Denn so nützlich und unkompliziert die Einspeisung von Daten aus einer URL auch sein mag, so resultiert daraus ein Korpus, der erstens mit Formatierungsschwierigkeiten arbeiten muss und dementsprechend langsamer als nötig geladen wird. Und zweitens wird jede Werbeeinblendung und jeder weiterführende Link als Teil des zu analysierenden Korpus behandelt. In dieser Hinsicht ist eine kritische Behandlung der präsentierten Daten unerlässlich.

Beispielanwendung

Die Arbeit mit Voyant ist nicht an vordefinierte Forschungsfragen gebunden. Aufgrund der hohen Menge an ermittelbaren Daten empfiehlt es sich vor allem für Anfänger, nicht ziellos an die Anwendung heranzutreten, da sonst die Interpretation erschwert wird. Analysen literarischer Texten sollten daher vorwiegend auf Hypothesen gestützt werden, die sich mit dem quantitativ arbeitenden Voyant realisieren lassen oder die flexibel genug sind, unter Umständen angepasst zu werden.

Fig.5 Anwendungsbeispiel

Als Beispielanalyse wird die Frage nach den Frauenfiguren und ihrer Darstellungen in einigen ausgewählten Märchen der Gebrüder Grimm formuliert. Wie werden Frauen und Mädchen in Schneewittchen, Dornröschen sowie Hänsel und Grethel charakteristisch dargestellt? Welche Rollen erfüllen sie? Die Wahl der Texte wird aufgrund ihres Bekanntheitsgrades getroffen, benutzt wird jeweils die 7.Auflage (Ausgaben letzter Hand) aus dem Jahr 1857. Die digitale Fassung der drei Märchen wird Wikisource entnommen und als Text-Datei abgespeichert. Mit der Upload-Funktion von Voyant können die Texte daraufhin geladen werden. Für diese Beispielanwendung soll der Fokus auf dem Inhalt der Märchen, weniger auf dem Stil, liegen. Um effektiver für diese sogenannte Contentanalyse arbeiten zu können, bietet es sich an, mit dem Zahnrad-Button über dem Words in the Entire Corpus-Panel eine deutschsprachige StopList zu aktivieren, um alle gängigen Wörter der Alltagssprache wie beispielsweise alle Relatoren etc. herauszufiltern. Die Tabelle ordnet nun die Frequenz der verbliebenen Wörter und zeigt diese in absteigender Reihenfolge an (Fig.5). Da das Interesse an den weiblichen Figuren der Märchen besteht, markiert man nun händisch alle relevant erscheinenden Schlagwörter weiblichen Geschlechts, die für die Prüfung der Hypothese hilfreich sein könnten, und erstellt sich durch das Hinzufügen dieser Auswahl eine Favoritenliste (Herzsymbol in der rechten Ecke des Panels). Zu den relevant erscheinenden Keywords gehören dabei neben Substantiven auch nach eigenem Ermessen als interessant erscheinende attributiv verwendete Adjektive, Adverbien, etc.

Die Word Trend Grafik zeigt daraufhin die Verteilung der Schlagwörter innerhalb der Segmente des Korpus an. Man erkennt auf den ersten Blick, dass Eigennamen wie Grethel nur innerhalb ihres jeweiligen Märchens auftreten, wohingegen die Bezeichnung „Alte“ durchweg in allen drei Texten verhältnismäßig ähnlich verteilt erscheint.

Dennoch ist Hänsel und Grethel der einzige Text, in dem parallel dazu die „Alte“ als Hexe näher beschrieben wird, während sie in den anderen beiden Märchen nicht als solche bezeichnet wird, sondern nur eine Interpretation ihrer Charakterisierung diesen Schluss zulässt. Diesen Hinweis erhält man, wenn man zu den Ergebnissen der Frequenzsuche den Kontext dank dem Keywords in Context-Panel, kurz KWIC, hinzuzieht.

Der Typus der alten Frau stellt in den ausgesuchten Märchen die wohl bekannteste Figur, nämlich die der Hexe, dar und ist in der Regel im Fortlauf der Handlung als solche anhand ihres Erscheinungsbildes identifizierbar. Die Favoritenliste aus dem Word in the Entire Corpus-Panel sollte im Laufe der Zusammenstellung aller weiblich konnotierten Schlagwörter daher „Alte“ und „Hexe“ beinhalten. Beide Wörter lassen sich durch Markierung der beiden HuG Fassungen im Words in Document-Panel hervorheben und werden dadurch im KWIC exemplarisch angezeigt. In der Fassung von 1812 wird die Hexe als „Steinalte Frau“ mit wackelndem Kopf charakterisiert und einige Zeilen darauf direkt als Hexe bezeichnet. Die Hänsel und Grethel-Fassung von 1857 zeigt dagegen einige weitere Details im äußeren Erscheinungsbild der Hexe: Dort stützt sie sich beim Gehen auf einer Krücke, hat „rothe Augen“ und erhält durch einen Autorenkommentar eine „feine Witterung“. Zudem erlaubt die Untersuchung mithilfe des KWIC-Panels das Erkennen der Hexe als kannibalistische Figur, welche den Wunsch hegt, die Kinder zu kochen und zu verspeisen. Trotz ihres Furcht einflösenden Äußeren gebärdet sich die alte Frau in der Erstfassung von 1812 recht arglos, als sie sich von Grethel in den Ofen schieben lässt. Die Fassung von 1857 zeigt im direkten Vergleich durch das KWIC, dass diese Naivität durch die Autoren korrigiert wurde: Nun beugt sich die alte Frau in Ofenöffnung, um zu prüfen, ob dieser heiß genug ist.

Nicht jede zauberkundige Märchengestalt ist automatisch als Hexe zu betiteln, oftmals können auch andere Figurentypen ähnlich bedrohliche Funktionen übernehmen. Häufig kristallisiert sich daher die Stiefmutter als ebenso böse Kontrastfigur heraus. Die Art und Weise ihrer destruktiven Handlungen sind nicht unähnlich, dennoch gibt es große Unterschiede gegenüber der Hexenfigur festzustellen. In dem Märchen Schneewittchen lässt sich mithilfe des KWIC feststellen, dass noch in der Version von 1812 die leibliche Mutter die Rolle der bösen, hexenähnlichen Gestalt übernimmt, wohingegen 1857 diese bereits durch die Stiefmutter ausgetauscht wurde. Schneewittchens Stiefmutter wird direkt als schöne Frau bezeichnet, aber hegt großen Neid gegenüber anderen schönen Frauen. Anders als bei den Hexen gibt also das äußere Erscheinungsbild keinen Hinweis auf die innere Gesinnung, vielmehr sind es ihre bösartigen Handlungen und ihre Maskierungen, die Auskunft über ihren Typus als Gegenspielerin geben. Auch hier kann man dies über die Kontext-Funktion untersuchen. Auskunft über die Vielfalt der Rollen gibt die vermehrte Kostümierung der Stiefmutter als einerseits „alte Krämerin“, „altes Weib“ und als harmlos erscheinende „Bauersfrau“. Differenzierter ist es bei Dornröschen. Dort zeigt sich die „Alte“ als ein „altes Mütterchen“, welches Dornröschen an ihrem Geburtstag in einem verlassenen Turm vorfindet. Ob es sich bei der Alten um die dreizehnte weise Frau handelt, die im Vorfeld des Märchens Dornröschen mit einem Fluch belegte, kann nur spekuliert werden. Trotzdem führt diese Figur unweigerlich zur Erfüllung des bösen Fluchs und kann somit in die Reihe der hexenhaften Gestalten unter den Frauenfiguren aufgenommen werden. Der Vergleich der beiden Fassungen mithilfe des KWIC zeigt zuerst die Änderungen, die an dem Märchen vollzog. Waren es 1812 noch Feen, die zur Feier der Prinzesinnengeburt eingeladen worden sind, so sind es 1857 weise Frauen.

Um die Feen und weisen Frauen besser untersuchen zu können empfiehlt sich an dieser Stelle erneut, in dem Words in Documents-Panel mit der Tastenkombination Shift und einem linken Mausklick die Dornröschen-Dokumente zu markieren und somit für das KWIC herauszufiltern. Die Figur der dreizehnten, weisen Frau gibt keinerlei Auskunft über ihr Aussehen oder wahres Alter. Die Rolle der alten Frau wird nur temporär angenommen, denn die Doppelbedeutung der alten Frau als einerseits einer mächtigen Gegenspielerin und andererseits einer harmlosen, vertrauenerweckenden Großmutter ermöglicht die dramatische Wendung, mit er das Märchen arbeitet. Innerhalb der Untersuchung prägnant erscheinender Schlagwörter wird deutlich, dass die Figur der weisen Frau gespalten ist: Einerseits obliegt ihr die Funktion der guten Patin, in der sie in helfender Funktion um das Wohl ihrer Schützlinge bemüht ist. Andererseits können auch in der Kategorie der weisen Frauen Einzelpersonen in der Funktion des Gegenspielers auftreten, die trotz ihrer zauberkundigen Fähigkeiten mit menschlichen Lastern behaftet sind. In Dornröschen ist dieser Umstand mithilfe des KWIC erkennbar, der das zornige und gekränkte Auftreten der dreizehnten weisen Frau verdeutlicht.

In allen drei Texten verfügen die Frauen, die mehr oder minder in der Rolle der Heldin fungieren, über einen Eigennamen. Schneewittchen (im Text Sneewittchen) und Grethel werden 37 Mal gezählt, während Dornröschen nur acht Mal namentlich genannt wird. Das mag daran liegen, dass das Märchen mit ingesamt 1.226 Wörtern im Vergleich zu Hänsel und Grethel (2.690) und Schneewittchen (2.851) das kürzeste der dreien ist. Dornröschen und Schneewittchen zeigen allerdings allein schon durch ihre Namensgebung ihren hohen gesellschaftlichen Status an. Ihre Namen beschreiben gleichzeitig das prägnanteste Merkmal der Figur: Schneewittchens Schönheit wird anhand der Ästhetik von Blutstropfen im Schnee determiniert, wohingegen Dornröschen nach dem Rosenranken benannt ist, die sich wie ein Käfig um die schlafende Schönheit legen und diese dennoch umschmeicheln. Beide sind Königstöchter (6). Grethel dagegen stammt aus einer armen Familie. Die Attribute, die das Mädchen umgeben, sind oberflächlich und reichen von Schwesterchen (6) bis zu Mädchen (2). Es ist bis zuletzt nicht klar, dass auch Grethel eine heimliche Heldin darstellt, da sie doch vorwiegend durch ihren Bruder charakterisiert wird. Indem sie aber letztlich diesen und sich selbst aus den Fängen der Hexe befreit, in dem sie die alte Frau in den Ofen stößt, zeigt sie eine starke Seite an dem sonst weinerlich und unmündig beschriebenen Kind. Anders als Grethel, können Dornröschen und Schneewittchen als passive Heldinnen bezeichnet werden. Ihre „Errettung“ durch die Königssöhne (9 Mal gezählt) erfolgt auffällig zufällig. Die zukünftigen Ehegatten werden zudem schon bei der ersten Begegnung akzeptiert.

Mithilfe also des KWIC können die ausgesuchten Schlagwörter innerhalb ihres Kontext näher untersuchen werden. Die Ergebnisse lassen im Laufe der Analyse ein differenziertes Rollenbild der weiblichen Figuren erkennen: Die negativ besetzten Attribute („alt“, „böse“) der weiblichen Antagonisten eröffnen mit einem Blick auf den Kontext ihrer Einbettung, dass mit verschiedenen Frauenfiguren gespielt wird, um das Vertrauen der Hauptcharaktere zu ergattern (gekränkte, weise Frau - altes Mütterchen; eitle, böse Stiefmutter - alte Krämerin). Auf der anderen Seite sind die „Heldinnen“ der Märchen mit Namen versehen. Dornröschen (8 Mal gezählt) und Sneewittchen (37) erhalten ihre Beschreibung mithilfe ihrer Namensgebung und werden zudem als Königstöchter (6) charakterisiert. Allein dieser Umstand erlaubt, die beiden Frauen mit Eigenschaften zu versehen, die ihre Schönheit und Tugenden hervorheben (bspw. Sneewittchen: schönste (16)). Grethel (37) wird in den unteren Rängen der Gesellschaft angesiedelt: Ihre Familie ist arm und leidet Hunger. Durch KWIC wird sichtbar, dass es ihr Bruder ist, der sie überwiegend durch seine Anrede charakterisiert. Ihre Beschreibung ist an ihr Geschlecht und ihre Funktion innerhalb des Märchens geknüpft (Schwesterchen (6), Mädchen (2)). Aber auch hier wird durch den Vergleich aufgezeigt, dass nicht jede positive Frauenfigur die Rolle des Opfers übernimmt. Wohingegen Dornröschen und Schneewittchen ihren Schicksalen ausgeliefert auf Rettung "von außen" entgegen schlafen, muss Grethel, die einzige mit einem tatsächlichen Namen, um ihr eigenes Leben und das ihres Bruders zu retten, gegen die Hexe vorgehen. Sie überwindet ihre Rolle des unmündigen, schwachen Mädchens mit dem Todesstoß, den sie der Hexe in den Ofen erteilt. Die positiv vorgestellten Frauen agieren also aufgrund ihrer verschiedenen gesellschaftlichen Positionen unterschiedlich in Problemsituationen.

Es zeigt sich also, dass die untersuchten Frauenfiguren bestimmte, zum Teil auch vielfältige Rollenbilder gemäß ihrer Funktion innerhalb des Märchens übernehmen. Für die Analyse solcher Ergebnisse empfiehlt es sich, im Vorfeld oder spätestens während der Analyse mithilfe des Corpus Readers die Einbettung der ausgesuchten Keywords im Kontext stärker zu beleuchten. Tatsächlich erfordert eine solche Analyse ein hohes Maß an manueller Eigenleistung. Aber mithilfe des KWIC-Panels wird die Untersuchung der gelieferten bzw. händisch ausgesuchten Keywords bequem vereinfacht, da diese einen erweiterbaren Blick auf das gesamte Korpus ermöglichen. Die Ausgabendaten, die Voyant liefert, reichen aber nicht aus, um eine semantische Interpretation der kontextuellen Beziehungen der Schlagwörter zu den Figuren durchzuführen. Dennoch erleichtern die gängigen Analysetools des Standard-Interfaces die Arbeit um einiges: die Frequenzanalyse und die Konkordanzanzeige verkürzen die Arbeitsschritte und bieten dadurch an, im nächsten Schritt der Analyse den Daten auf statistischer Ebene mehr Aufmerksamkeit schenken zu können.

Literatur

Weblinks