Google Ngram Viewer

Aus Literatur Rechnen - Neue Wege der Textanalyse
Wechseln zu: Navigation, Suche

Der Google Ngram Viewer untersucht mittels Data Mining, wie häufig in gedruckten Publikationen der letzten fünf Jahrhunderte ausgesuchte Wortformen, hier als n-grams konzipiert, gebraucht werden. Der Benutzer kann n-grams nach Belieben eingeben und deren Gebrauchsfrequenz auch miteinander vergleichen. Das Programm wird gebraucht, um anhand von sprachlichem Wandel Überlegungen über soziale, kulturelle und technische Veränderungen empirisch zu prüfen. Die Darstellung erfolgt visuell eingänglich und benutzerfreundlich in Graphen. Das Tool produziert schnell und mit wenig Aufwand für den Benutzer anschauliche Resultate; es ist dabei auch bei Benutzern beliebt, die ohne Einarbeitungszeit ihre Ideen an riesigen Datenbeständen erprobieren möchten. Der Google Ngram Viewer stützt sich auf Textkorpora, die im Rahmen des Projektes Google Books entstanden. Sie werden in den Sprachen Deutsch, Englisch, Französisch, Hebräisch, Russisch und Spanisch angeboten und umfassen den Inhalt von 5,2 Millionen Büchern, die von den Jahren 1500-2008 gedruckt wurden. Der Google Ngram Viewer wurde von den Angehörigen der Harvard University Jean-Baptiste Michel und Erez Liebermann Aiden entwickelt und Ende 2010 veröffentlicht. Das Projekt wurde unterstützt von der Harvard University, dem U.S. Department of Health & Human Services, Google und weiteren Institutionen.

Allgemeines

  • Technische Voraussetzungen: Der Google Ngram Viewer ist mit jedem üblichen Internetbrowser zu benutzen. Die aufwendigen Zählvorgänge werden von Googles Servern geleistet und belasten den Computer des Benutzers nicht.
  • Aktuelle Version: Die hier besprochene Version wurde 2010 veröffentlicht und verwendet Textkorpora, die im Juli 2009 generiert wurden. Die verschiedenen Korpora sind mit Versionsnummern gekennzeichnet, das Tool Google Ngram Viewer ist es momentan nicht.
  • Neben der Benutzeroberfläche Google Ngram Viewer werden auch die Datasets angeboten, auf die das Tool sich stützt. Die zur Verfügung gestellten Dateien mit den Datasets sind aufgrund ihrer Größe nicht mit jedem Computer zu öffnen und verlangen vom Benutzer mehr Wissen, um zu Ergebnissen zu gelangen. Ihre Benutzung wird in einem eigenen Abschnitt getrennt vom Tool behandelt.

Detaillierte Beschreibung des Tools

Arbeitsschritte

Mögliche Analysen

Benutzerfreundlichkeit und Transparenz

Beispielanwendung

Fazit und Diskussion

Zukunftspläne für CATMA

Literatur