Diskussion:Google Ngram Viewer: Unterschied zwischen den Versionen

Aus Literatur Rechnen - Neue Wege der Textanalyse
Wechseln zu: Navigation, Suche
(Neuer Abschnitt Abschnitt NEP, kyrillische Datasets)
(Die Seite wurde geleert.)
 
Zeile 1: Zeile 1:
Hier ein erster Kommentar, der Rest folgt vor dem 3.9.--[[Benutzer:Berenike Herrmann|Berenike Herrmann]] ([[Benutzer Diskussion:Berenike Herrmann|Diskussion]]) 15:16, 16. Aug. 2012 (CEST)
 
Zitat: <span style="color:#CD2626;"> Der Google Ngram Viewer untersucht mittels Data Mining, wie häufig in gedruckten Publikationen der letzten fünf Jahrhunderte ausgesuchte '''Wortformen''', hier als n-grams konzipiert, gebraucht wurden.</span>  '''Wortformen''' ist hier missverständlich, da es beim Ngram Viewer um die Frequenz von Wortfolgen geht (d.h. ''n'' entspricht der Anzahl der Wörter) --[[Benutzer:Berenike Herrmann|Berenike Herrmann]] ([[Benutzer Diskussion:Berenike Herrmann|Diskussion]]) 15:13, 16. Aug. 2012 (CEST)
 
  
Danke für den Hinweis, er trifft ein Problem, das ich beim Schreiben hatte. Von Wortformen ist zunächst die Rede, um zwischen Lemma und Wortform zu differenzieren. Aus der Linguistik habe ich in dunkel in Erinnerung, dass der Begriff "Wort" linguistisch ungebräuchlich sei, da nicht genau definiert (So auch gelesen im Lexikon der Sprachwissenschaft von Hadumod Bußmann). Den Begriff "Wortform" habe ich verwendet, weil ich den Ngram Viewer so verstehe, dass er eben Wortformen zählt. Er kann zeigen, wie oft die Wortformen "expressionistischer", "expressionistische", "expressionistischen" gebraucht werden, aber nicht, wie oft das Lemma "expressionistisch" gebraucht wird, zu dem die genannten Wortformen gehören. Aufgrund so einer Überlegung schreibe ich von Wortformen, vielleicht ist so eine Differenzierung hier aber auch gar nicht nötig, da der Ngram Viewer nicht zwischen Lemma und Wortform differenziert, bzw. diese zusammenfallen. Der Begriff "Wortform" wirkt natürlich sperrig.
 
 
== Abschnitt NEP, kyrillische Datasets ==
 
 
Den Abschnitt hätte ich gerne bereits zuende geschrieben, allerdings würde ich zur gestellten Frage gerne die russischen, in kyrillischer Sprache geschriebenen Datasets einsehen. Die kann ich leider nicht korrekt öffnen und sehe nicht die korrekten Schriftzeichen. Ich habe Herrn Munson gefragt, ob er vielleicht Rat weiß.
 

Aktuelle Version vom 5. Juni 2013, 19:45 Uhr