Korpora

Aus Literatur Rechnen - Neue Wege der Textanalyse
Wechseln zu: Navigation, Suche

Zeno.org im TextGrid Repository: http://www.textgrid.de/Digitale-Bibliothek

Deutsches Textarchiv: http://www.deutschestextarchiv.de/

Beide Korpora streben Repäsentativität für deutschsprachige Literatur bis ca. 1900 an und haben sehr hohe editorische Standards.


Weitere Korpora, Korpus- und digitale Textsammlungen sind hier zu finden:

Projekt Gutenberg DE http://gutenberg.spiegel.de/

Project Gutenberg http://www.gutenberg.org/

AAC-Austrian Academy Corpus http://www.aac.ac.at/

Oxford Text Archives http://ota.ahds.ac.uk/catalogue/index-id.html

Das Mannheimer Korpus 1 und 2 (1949 – 1974) vom Institut für Deutsche Sprache, zusammen ca. 2,5 Mill. Wörter, verschiedene Genres und Register (nach Registrierung herunterladbar): http://www.ids-mannheim.de/kl/projekte/korpora/verfuegbarkeit.html

Übersicht von unterschiedl. Korpora bei Noah Bubenhofer (der übrigens auch einen Korpuslinguistikkurs anbietet): http://www.bubenhofer.com/

„Corpora from the Web“ http://hpsg.fu-berlin.de/cow/


Die freie digitale Bibliothek http://www.digbib.org/

Literaturnetz http://literaturnetz.org/

Wikisource http://de.wikisource.org/wiki/Hauptseite

GerManC Corpus http://www.ota.ox.ac.uk/desc/2544 a multi-genre representative corpus of Early Modern German from 1650-1800