Voyant: Unterschied zwischen den Versionen

Aus Literatur Rechnen - Neue Wege der Textanalyse
Wechseln zu: Navigation, Suche
(Transparenz)
Zeile 74: Zeile 74:
 
== '''Transparenz''' ==
 
== '''Transparenz''' ==
  
Möchte man mithilfe von Voyant eigene Tools entwickeln, so kann man von Seiten der Hermeneuti.ca-Entwicklern Unterstützung erhalten. Besonders die Auswahl im Bereich des Datenexports zeigt den Wunsch der Entwickler an diejenigen Nutzer mit Programmierkenntnissen, mithilfe von Voyant eigene Projekte zu entwickeln(siehe Abb.4 Exportmöglichkeiten). Der Quellcode von Voyant darf und soll zu diesem Zweck benutzt werden. Eigens für Tool-Entwickler und Programmierer wurde ein [http://hermeneuti.ca/node/104 Manual] aufgesetzt, die den Nutzern die wichtigsten Herangehensweisen mit dem Tool näher bringt, ihnen genauere Details zu den Tools verrät sowie den Quellcode zugänglich macht. Hermeneuti.ca begrüßt das Interesse anderer Entwickler  mit dem Gedanken an die Verbesserungen an Voyant selbst, die durch eine intensive, externe Arbeit mit dem Quellcode einher geht. Dennoch betont man die Fehler und Bugs des unausgereiften Tools:
+
Möchte man mithilfe von Voyant eigene Tools entwickeln, so kann man von Seiten der Hermeneuti.ca-Entwicklern Unterstützung erhalten. Besonders die Auswahl im Bereich des Datenexports zeigt den Wunsch der Entwickler an diejenigen Nutzer mit Programmierkenntnissen, mithilfe von Voyant eigene Projekte zu entwickeln(siehe Abb.4 Exportmöglichkeiten). Der Quellcode von Voyant darf und soll zu diesem Zweck benutzt werden. Eigens für Tool-Entwickler und Programmierer wurde ein [http://hermeneuti.ca/node/104 Manual] aufgesetzt, die den Nutzern die wichtigsten Herangehensweisen mit dem Tool näher bringt, ihnen genauere Details zu den Tools verrät sowie den Quellcode zugänglich macht. Hermeneuti.ca begrüßt das Interesse anderer Entwickler  mit dem Gedanken an die Verbesserungen an Voyant selbst, die durch eine intensive, externe Arbeit mit dem Quellcode einher geht. Dennoch betont man die Fehler und Bugs des (noch) unausgereiften Tools:
  
 
„Voyeur is a work in progress – it is currently in beta. Some things don't work properly, some planned features aren't available yet. In particular, here are some weaknesses that we recognize:
 
„Voyeur is a work in progress – it is currently in beta. Some things don't work properly, some planned features aren't available yet. In particular, here are some weaknesses that we recognize:

Version vom 13. August 2012, 16:02 Uhr

Voyant (frz. für sehend, auffallend. Bis zum 19.0ktober 2011 unter dem Namen Voyeur bekannt) ist ein webbasiertes, englischsprachiges Tool zur computergestützten Analyse digitaler Texte. Es ist Teil des unter dem Namen Hermeneuti.ca - The Rhetoric of Text Analysis laufenden, kollaborativen Projekts der Kanadier Stefan Sinclair (McGill University ) und Geoffrey Rockwell (University of Alberta). Das Ziel der seit 2008 bestehenden Projektgruppe ist es, die Rhetorik und die Anwendung in der computergestützten Korpusanalyse zu theoretisieren, sowie die dazu verwendeten Tools und Programme zu entwickeln und auszubauen.[1] Voyant offeriert eine relativ große Bandbreite an kleineren Tools zur Analyse literarischer Texte sowie zur Visualisierung der Ergebnisse. Zudem ist die Nutzung von Voyant kompatible zu anderen Analysetools, wie beispielweise AntConc. Die Projektgruppe bietet fortgeschrittenen Anwendern die Möglichkeit, mithilfe von Voyant eigene Tools zu einzubinden oder zu entwickeln. Im Moment ist das Tool unter drei URLs zu erreichen: http://www.voyant-tools.org, http://voyeur.hermeneuti.ca und http://voyeurtools.org.

Allgemeine Voraussetzungen

Um mit dem webbasierten Tool Voyant arbeiten zu können, benötigt man in erster Linie einen Computer mit Internetanschluss. Programmiert wurde es mit Java, weshalb eine Vorinstallation Javas vor der ersten Benutzung Voyants zu empfehlen ist. Abgesehen davon sind keine weiteren technischen Voraussetzungen nötig: Voyant kann mit verschiedenen Browsern wie z.B. Firefox, Internet Explorer, Google Chrome oder Safari geöffnet werden. Das kostenlose Tool befindet sich zur Zeit in der Beta-Version 1.0, eine Registrierung auf hermeneuti.ca ist nicht notwendig. Die Ergebnisse, die man im Laufe seiner Arbeit mit Voyant sammelt, können über verschiedene Exportmöglichkeiten wie zum Beispiel

  • als HTML-Quellcode, den man in externe Seiten einbinden kann
  • als fertig generierte URL
  • als bibliographische Zitation

oder

  • als tabellarisierte oder rohe Datensätze

gesichert werden. Die Ausgabe dieser Sicherungsmöglichkeiten erfolgt über .xml-, .html- oder reine Text-Dateien.

Detaillierte Beschreibung des Tools

Das Standard-Interface

Abb. 1 Startseite
Unter Aufrufen einer der drei möglichen URLs http://www.voyant-tools.org, http://www.voyeur.hermeneuti.ca oder http://www.voyeurtools.org wird der Benutzer auf die Startseite des Tools geleitet.
Abb. 2 Texteinspeisung

Durch das mittig platzierte Eingabefeld können Texte aus verschiedenen Quellen dem zu analysierenden Korpus hinzugefügt werden (Abb. 1). Dazu kann man entweder einen ganzen Volltext mithilfe von Copy and Paste in das Eingabefeld einfügen, oder gar, wenn es sich um einen online verfügbaren Text handelt, die URL des Onlinemediums in das Eingabefeld einspeisen und mit dem Reveal-Button hochladen. Befindet sich die zu analysierende Textdatei auf der Festplatte des benutzten Computers, so kann mit der unter dem Eingabefeld befindlichen Upload-Funktion die Datei ausgesucht werden (Abb. 2).

Sollte man keinen Text zur Verfügung haben, gibt es die Möglichkeit, mit zwei bereits vorgefertigten Beispielkorpora zu arbeiten. Man kann dann zwischen den gesammelten Stücken Shakespeares oder den Listserv Archiven der geisteswissenschaftlichen Community von Hermeneuti.ca auswählen.

Abb. 3 Standard-Interface

Das so geladene Korpus (Abb. 3) wird auf einer standardisierten Benutzeroberfläche angezeigt, welche in verschiedene Segmente, sogenannte Panels, eingeteilt ist. Eines davon ist der zentral gelegene Corpus Reader, der den oder die geladenen Text-e anzeigt. Diese werden in gleich große Segmente unterteilt (gestrichelter Balken am linken Panelrand) und können durch Mausklick aufgerufen werden. Korpora, die aus mehreren Datensätzen bestehen, werden im Balken farbig dargestellt und können somit schnell unterschieden werden. Die jeweils starke oder schwache Färbung der einzelnen Segmente des Balkens gibt einen Hinweis auf die Häufigkeit der durch den Anwender ausgesuchten Schlagwörter (oder auch Keywords) in dem jeweiligen Textausschnitt. Diese Keywords werden im Corpus Reader gelb markiert und kurz rot umrandet, wenn man sie mit einem Mausklick auswählt.

Rechts und links werden Analyse- und Interpretationstools geladen, welche sich quantitativ mit dem Korpus auseinander setzen. Dazu gehören im linken Interface-Bereich

  • Cirrus visualisiert die häufigsten Wortfrequenzen mit Hilfe der Darstellung dieser Wörter in einem zufälligen Arrangement. Die häufigsten Wörter werden dabei größer dargestellt und mittig platziert.
  • Summary bietet einen informativen Überblick über die prägnantesten Merkmale der geladenen Dokumenten, wie bspw. die gesamte Anzahl der Dokumente sowie die Anzahl der darin befindlichen Tokens und Types

und

  • Words in the Entire Corpus tabellarisiert die Wortfrequenzen und untersucht diese hinsichtlich statistischer Merkmale wie beispielsweise der Standardabweichung oder dem Z-Score. Hier besteht auch die Möglichkeit, eine StopList anzuwenden, um die gängigsten Wörter der Alltagssprache herauszufiltern. Die Suchfunktion im unteren Bereich des Panels erlaubt es mithilfe der Eingabe einzelner sowie mehrerer Wörter (mit Kommata voneinander getrennt) oder Satzteile (von Anführungszeichen umrahmt) diese im Corpus Reader zu suchen und zu markieren.

Die rechten Panels unterteilen sich in

  • Word Trend visualisiert grafisch die relative Frequenz eines Keywords, verteilt auf die Segmente des Dokuments),
  • Keyword in Context ( auch KWIC, zeigt die Konkordanzen eines Keywords auf. Rechts und links vom Schlagwort wird ein Ausschnitt des Satzes angezeigt. Mithilfe der Preview- und Context-Buttons am unteren Abschnitt des Panels kann die Wortanzahl des Kontextabschnitts zwischen 5 und 500 Wörtern auf jeder Seite eingestellt werden.
  • Words in Documents zeigt statistische Informationen, ähnlich dem Word in the Entire Corpus-Panel, zum ausgewählten Keyword in allen geladenen Dokumenten des Korpus an.
Abb. 4 Exportmöglichkeiten

Jedes Panel verfügt in seiner Kopfleiste über eine Reihe an Funktionssymbolen: Mithilfe des Zahnrads kann man für jedes Panel Optionen einstellen, welche beispielsweise einen Wortfilter (die sogenannte StopList filtern die gängigsten Wörter der Alltagssprache) aktivieren oder den Z-score einstellen. Ebenso verfügt jedes Panel über ein Hilfesymbol in Form eines Fragezeichens, welche kurze Erklärungen gibt sowie bei Bedarf den Nutzer auf die Projektseite hermeneuti.ca weiterleitet. Dort gibt es Tutorials, Videos und den sogenannten Quick Guide for Voyeur Users, mit dessen Hilfe man seine ersten Schritte mit Voyant meistern kann.

Die Datensicherung erfolgt über das Diskettensymbol, welches sich über jedem Panel befindet. Es bieten daraufhin mehrere Möglichkeiten der Datensicherung an. Alle ermittelten Daten können entweder in Form einer URL oder zur Einbindung auf bspw. einem Internet-Blog als sogenanntes HTML-Snippet gesichert werden (Abb. 4). Die Sicherung bleibt, ebenso wie das temporäre Speichern der Daten während der Arbeitssitzung, nur für kurze Zeit erhalten. Unter Umständen können mit jedem Versionen-Update oder nach langer Nicht-Nutzung die URL- sowie HTML-Dateien, die vorwiegend auf externen Onlinemedien gesichert wurden, an Gültigkeit verlieren. Die Auswahl dieser Datensicherungen stützt sich auf den Wunsch der Entwickler, die Arbeit und Ergebnisse mit Voyant zu verbreiten. Es soll weiterhin ermöglicht werden, die Arbeiten anderer Anwender bearbeiten und verbessern zu können. Ob sich diese Form der Datensicherung in den nächsten Versionen von Voyant verändern wird, ist abhängig von den Erfahrungsberichten der Tool-Benutzer sowie den Bug-Meldungen.

Der SkinBuilder

Mithilfe des Export-Buttons in der obersten blauen Kopfleiste des Interfaces kann auf Wunsch der Nutzer auf den sogenannten SkinBuilder von Voyant weitergeleitet werden. Diese Funktion ermöglicht es, sich eine individuelle Benutzeroberfläche aus der Auswahl an Tools zusammen zu stellen, die Voyant zur Analyse von Texten anbietet. Die zum größten Teil aus Visualisierungstools bestehenden Ergänzungen können in vorher definierte Interface-Raster gezogen oder durch Doppelklick eingefügt werden. Alle zur Auswahl stehenden Features werden im Folgendem aufgelistet und kurz erklärt.

Detailliertere Informationen zu den Visualierungsfeatures findet man auf http://hermeneuti.ca/voyeur/tools.

Daten-Einspeisung

Nahezu alle gängigen Textdateiformate werden von Voyant erkannt und in die Analyselandschaft hochgeladen. Neben Word-, Text- und PDF-Dateien ist somit auch die Einspeisung von Rich Text Formaten (.rtf), XML- oder HTML-Dateien möglich. Kleinere Datensätze, bestehend aus einzeln hoch geladenen Textdateien, werden innerhalb kurzer Zeit geladen. Um größere Mengen an Daten – mehrere Mega- bis zu Gigabyte – in Voyant zu laden, benötigt man allerdings eine recht hohe DSL-Bandbreite. Eine Vor-Annotation ist für die Verwendung mit Voyant nicht nötig, vor allem aber im Moment auch nicht anzuwenden. Jede Art von öffentlich zugänglichen Texten kann theoretisch geladen und untersucht werden.

Benutzerfreundlichkeit

Voyant richtet sich an ein breites Spektrum an Nutzern. Das übersichtliche und schnell zugängliche Interface erleichtert jedem Neueinsteiger auf dem Gebiet der computergestützten Textanalyse den Zugang zu Voyant. Jedes Panel bietet neben einem Optionen- und Export-Button auch eine Hilfestellung an. Jedes einzelne Panel wird somit erklärt und kann separat erkundet werden. Bietet der Help-Button noch zu wenig Erklärung, kann ein Mausklick auf more getätigt werden, der den Benutzer auf die Entwicklungsseite weiterleitet. Dort können zu verschiedenen Bereichen rund um Voyant mithilfe von Video- und Text-Tutorials und sogenannte Recipes (Anwendungsbeispiele) eingesehen werden. Zudem erleichtert der eigens für Voyant vorliegende Quick Guide die ersten Schritte mit dem Tool. Die Interpretation der erarbeiteten Daten dagegen erschließt sich aufgrund der hohen Dichte an statistischen Forschungsdaten bereits erfahrenen Nutzern weitaus leichter. Dennoch können auch Anfänger einfache Fragestellungen an literarischen Texent mit Voyant erarbeiten.

Transparenz

Möchte man mithilfe von Voyant eigene Tools entwickeln, so kann man von Seiten der Hermeneuti.ca-Entwicklern Unterstützung erhalten. Besonders die Auswahl im Bereich des Datenexports zeigt den Wunsch der Entwickler an diejenigen Nutzer mit Programmierkenntnissen, mithilfe von Voyant eigene Projekte zu entwickeln(siehe Abb.4 Exportmöglichkeiten). Der Quellcode von Voyant darf und soll zu diesem Zweck benutzt werden. Eigens für Tool-Entwickler und Programmierer wurde ein Manual aufgesetzt, die den Nutzern die wichtigsten Herangehensweisen mit dem Tool näher bringt, ihnen genauere Details zu den Tools verrät sowie den Quellcode zugänglich macht. Hermeneuti.ca begrüßt das Interesse anderer Entwickler mit dem Gedanken an die Verbesserungen an Voyant selbst, die durch eine intensive, externe Arbeit mit dem Quellcode einher geht. Dennoch betont man die Fehler und Bugs des (noch) unausgereiften Tools:

„Voyeur is a work in progress – it is currently in beta. Some things don't work properly, some planned features aren't available yet. In particular, here are some weaknesses that we recognize:

  • lack of more advanced linguistic processing (lemmatization, parts of speech, semantic awareness)
  • lack of XML-aware analytic features (though XML is a valid input format)
  • the current default skin (configuration of tools) is not well-suited to reading texts
  • some of the user documentation is a bit bare
  • other funcitonality:
  • proximity searching of terms
  • multi-word (n-gram) views (though you can search for specific phrases)“ [2]

Die Arbeit an und mit Voyant ist, auch mithilfe und eben aufgrund der spezifische Möglichkeit der Datensicherung, an eine Veröffentlichung im Bereich der wissenschaftlichen Essays oder Internet-Blogs angepasst. Das Melden von Bugs sowie jegliche Art der konstruktiven Kritik sind explizit von der Hermeneuti.ca-Community gewünscht. Diskussionen, Verbesserungen sowie Erweiterungen werden in der Hermeneuti.ca-Community auf ihrem Blog öffentlich besprochen.

Fazit

Mithilfe von Voyant lassen sich, ähnlich wie bei AntConc und Wmatrix, beliebig große Textkorpora quantitativ auf Konkordanz und Wortfrequenz untersuchen. Das Tool bietet durch eine große Zahl an Visualisierungsfeatures und die vor allem auf eine Veröffentlichung hinzielende Art der Datensicherung ein breites Spektrum an Möglichkeiten, die Arbeitsergebnisse mit und das Tool selbst anschaulich darzustellen und ausbauen zu können. Eine Zusammenarbeit mit dem Textanalyse-Tool TaPor ermöglicht zudem, die Ergebnisse aus beiden Tools in das jeweils andere zu exportieren. Das Interface ist einfach und übersichtlich gestaltet, eignet sich daher also ebenso für Anfänger auf dem Gebiet der computergestützten Korpuslinguistik, wie auch für Fortgeschrittene oder Programmentwickler. Aufgrund der hohen Dichte an statistischen Fragestellungen, die man mithilfe einiger Optionen in den überwiegend tabellarischen Features einstellen und am Text prüfen lassen kann (beispielsweise den Z-score oder die Standardabweichung, etc), ist dagegen die Interpretation der gelieferten Ergebnisse für Neueinsteiger eher schwierig.

Das Standard-Interface kann durch den sogenannten SkinBuilder individuelle verändert und der jeweiligen Forschungsfrage an das Tool angepasst werden. Diese Möglichkeit lässt sich in jeder beliebigen Arbeitsphase einstellen. Es ist nicht zwingend notwendig, bereits über digitale Texte oder über eine Forschungsfrage zu verfügen, um mit Voyant arbeiten zu können. OpenSource-Texte können ebenso unkompliziert per URL-Adresse oder als Volltext geladen werden, wie Dateien von der Festplatte oder das bereits vor gespeicherte Referenzkorpus der Entwicklergruppe. Zur Auswahl stehen dabei zwei Typen von literarischen Texten: Zum einen die gesammelten Stücke von Shakespeare, zum anderen ein Archiv der Email-Dialoge der geisteswissenschaftlichen Community von Hermeneuti.ca. Unabhängig von der Entscheidung, wie man seinen Korpus zusammenstellt und - bei Bedarf - unter welcher Frage man es untersucht, bleibt der Zeitaufwand gemessen an den Ergebnissen, die sich mithilfe von Voyant erzielen lassen, eher gering. Die Texte benötigen im Vorfeld keine Annotation, da Voyant vorwiegend quantitativ arbeitet.

Es empfiehlt sich, sich bei der Arbeit mit Voyant auf der Ebene von oberflächenstrukturellen Fragen zu bewegen, da diese in der Regel von dem Tool zuverlässig untersucht werden können. Obwohl Voyant auch in der Lage ist, Kollokationen aufzufinden, ist diese Funktion oftmals noch stark verbuggt. Diffizile Untersuchungsfelder wie Spannung und Ironie erfordern eine höhere Ebene der Analyse, die Voyant (noch) nicht leisten kann. Die zeitintensive Vorarbeit und die konzeptionelle Schärfe des Forschenden, die dazu nötig wären komplexere oder abstraktere Fragestellungen hinsichtlich der Semantik oder Grammatik eines Textes zu untersuchen, hätten jedoch den positiven Nebeneffekt, dass die entwickelten Ergebnisse nicht für selbstverständlich genommen werden. Im Moment bewirkt die enorme Menge an statistischen Daten, die Voyant liefert, leider genau das. Dennoch bietet Voyant den ersten Schritt in die richtige Richtung: Das effektive, methodologische Vorgehen Voyants, durch das sture Zählen von Wörtern in ein oder mehreren, bis zu einigen GB großen Datensätzen, leistet eine Arbeit, die händisch ein ausgesprochen Zeit intensives Projekt bedeuten würde. Die weitere Interpretationsphase, gemäß der Forschungsfrage, muss vom Forschenden übernommen werden. Rommel bemerkt dazu: "No immediate result,(...), can be obtained by the computer, but data are collected that allow for and require further analysis and interpretation by the researcher. The results, however, are impressive."

Voyant ist momentan als Beta-Version zugänglich; die weiteren, bereits jetzt auf dem Projekt-Blog Hermeneuti.ca's nachzulesenden Entwicklungsschritte lassen allerdings hoffen, in baldiger Zukunft auch semantische Analysen durchführen zu können. Wünschenswert wäre in dieser Hinsicht auch die Möglichkeit, eigene Stoplisten aufsetzen zu können sowie das Tool mithilfe von händischen Annotationen darauf zu trainieren, unwichtige Elemente im Korpus zu prüfen und bei Bedarf in einen separaten Unterordner herauszufiltern. Denn so nützlich und unkompliziert die Einspeisung von Daten aus einer URL auch sein mag, so resultiert daraus ein Korpus, der erstens mit Formatierungsschwierigkeiten arbeiten muss und dementsprechend langsamer als nötig geladen wird. Und zweitens wird jede Werbeeinblendung und jeder weiterführende Link als Teil des zu analysierenden Korpus behandelt. In dieser Hinsicht ist eine kritische Behandlung der präsentierten Daten unerlässlich.

Beispielanwendung

Die Arbeit mit Voyant ist nicht an vordefinierte Forschungsfragen gebunden, kann aber aufgrund der hohen Menge der ermittelten Daten von Vorteil sein. Analysen literarischer Texten sollten daher vorwiegend auf Hypothesen gestützt werden, die sich mit dem quantitativ arbeitenden Voyant realisieren lassen oder die flexibel genug sind, unter Umständen angepasst zu werden.

Fig.5 Anwendungsbeispiel

Als Beispielanalyse wird die Frage nach den Frauenfiguren und ihrer Darstellungen in einigen ausgewählten Märchen der Gebrüder Grimm formuliert. Wie werden Frauen und Mädchen in Schneewittchen, Dornröschen sowie Hänsel und Grethel charakteristisch dargestellt? Welche Rollen erfüllen sie? Die Wahl der Texte wird aufgrund ihres Bekanntheitsgrades getroffen, benutzt wird jeweils die 7.Auflage (Ausgaben letzter Hand) aus dem Jahr 1857. Die digitale Fassung der drei Märchen wird Wikisource entnommen und als Text-Datei abgespeichert. Mit der Upload-Funktion von Voyant können die Texte daraufhin geladen werden. Um effektiver arbeiten zu können, bietet es sich an, mit dem Zahnrad-Button über dem Words in the Entire Corpus-Panel eine deutschsprachige StopList zu aktivieren, um alle gängigen Wörter der Alltagssprache wie beispielsweise alle Relatoren etc. herauszufiltern. Die Tabelle ordnet nun die Frequenz der verbliebenen Wörter und zeigt diese in absteigender Reihenfolge an (Fig.5). Da das Interesse lediglich an den Frauen der Märchen besteht, markiert man nun händisch alle Schlagwörter weiblichen Geschlechts, die für die Prüfung der Hypothese hilfreich sein könnten, und erstellt sich durch das Hinzufügen dieser Auswahl eine Favoritenliste (Herzsymbol in der rechten Ecke des Panels).

Die Word Trend Grafik zeigt daraufhin die Verteilung der Schlagwörter innerhalb der Segmente des Korpus an. Man erkennt auf den ersten Blick, dass Eigennamen wie Grethel nur innerhalb ihres Märchens gezählt werden, wohingegen die Bezeichnung „Alte“ durchweg in allen drei Texten verhältnismäßig ähnlich verteilt erscheint.

Dennoch ist Hänsel und Grethel der einzige Text, in dem parallel dazu die „Alte“ als Hexe näher beschrieben wird. Diesen Hinweis erhält man, wenn man zu den Ergebnissen der Frequenzsuche den Kontext dank dem Keywords in Context-Panel hinzuzieht.

Mithilfe also des KWIC können die ausgesuchten Schlagwörter innerhalb ihres Kontext näher untersuchen werden. Die Ergebnisse lassen im Laufe der Analyse ein differenziertes Rollenbild der weiblichen Figuren erkennen: Die negativ besetzten Attribute („alt“, „böse“) der weiblichen Antagonisten eröffnen mit einem Blick auf den Kontext ihrer Einbettung, dass mit verschiedenen Frauenfiguren gespielt wird, um das Vertrauen der Hauptcharaktere zu ergattern (gekränkte, weise Frau - altes Mütterchen; eitle, böse Stiefmutter - alte Krämerin). Auf der anderen Seite sind die „Heldinnen“ der Märchen mit Namen versehen. Dornröschen (8 Mal gezählt) und Sneewittchen (37) erhalten ihre Beschreibung mithilfe ihrer Namensgebung und werden zudem als Königstöchter (6) charakterisiert. Allein dieser Umstand erlaubt, die beiden Frauen mit Eigenschaften zu versehen, die ihre Schönheit und Tugenden hervorheben (bspw. Sneewittchen: schönste (16)). Grethel (37) wird in den unteren Rängen der Gesellschaft angesiedelt: Ihre Familie ist arm und leidet Hunger. Durch KWIC wird sichtbar, dass es ihr Bruder ist, der sie überwiegend durch seine Anrede charakterisiert. Ihre Beschreibung ist an ihr Geschlecht und ihre Funktion innerhalb des Märchens geknüpft (Schwesterchen (6), Mädchen (2)). Aber auch hier wird durch den Vergleich aufgezeigt, dass nicht jede positive Frauenfigur die Rolle des Opfers übernimmt. Wohingegen Dornröschen und Schneewittchen ihren Schicksalen ausgeliefert auf Rettung durch Außerhalb entgegen schlafen, muss Grethel, die einzige mit einem tatsächlichen Namen im Gegenzug, um ihr eigenes Leben und das ihres Bruders zu retten, gegen die Hexe vorgehen. Sie überwindet ihre Rolle des unmündigen, schwachen Mädchens mit dem Todesstoß, den sie der Hexe in den Ofen erteilt. Die positiv vorgestellten Frauen agieren also aufgrund ihrer verschiedenen gesellschaftlichen Positionen unterschiedlich in Problemsituationen.

Es zeigt sich also, dass die untersuchten Frauenfiguren bestimmte, zum Teil auch vielfältige Rollenbilder gemäß ihrer Funktion innerhalb des Märchens übernehmen. Die Analyse solcher Ergebnisse erfordert, dass der Benutzer des Tools entweder im Vorfeld oder spätestens während der Analyse mithilfe des Corpus Readers dem Inhalt der Texte mehr Aufmerksamkeit schenkt. Die bloßen Ausgabendaten, die Voyant liefert, reichen nicht aus, um eine semantische Interpretation der kontextuellen Beziehungen der Schlagwörter zu den Figuren durchzuführen. Dennoch erleichtern die gängigen Analysetools des Standard-Interfaces die Arbeit um einiges: die Frequenzanalyse und die Konkordanzanzeige verkürzen die Arbeitsschritte und bieten dadurch an, im nächsten Schritt der Interpretation den Daten vor allem auf statistischer, aber auch auf semantischer Ebene mehr Aufmerksamkeit schenken zu können.

Literatur

Weblinks