Interner Link: Unterschied zwischen den Versionen

Aus Literatur Rechnen - Neue Wege der Textanalyse
Wechseln zu: Navigation, Suche
(1. Allgemeine Voraussetzungen)
(Die Seite wurde geleert.)
 
(4 dazwischenliegende Versionen des gleichen Benutzers werden nicht angezeigt)
Zeile 1: Zeile 1:
== Software 1 ==
 
  
externer Link [http://www.antlab.sci.waseda.ac.jp/software.html]
 
 
 
== Systematik (erste Test-Version) ==
 
 
----
 
 
== '''Allgemeine Voraussetzungen''' ==
 
 
*1.1. Gibt es für verschiedene Betriebssysteme verschiedene Versionen? (MAC, PC, Linux)
 
*1.2. Welche technischen Voraussetzungen sind nötig? (Version Betriebssystem, Arbeitsspeicher, Flash Player etc.)
 
*1.3. Ist das Tool browserbasiert oder Installationssoftware?
 
*1.4. Ist Registrierung notwendig? In diesem Zusammenhang wichtig: Können  Daten und Ergebnisse (online) gespeichert werden? Wie kann man Daten exportieren?
 
*1.5. Ist das Tool kostenpflichtig?
 
 
== '''2. Was leistet das Tool? Und auch: was nicht?''' ==
 
 
2.1. Erlaubt das Tool (a) die Einzelanalyse von [Texten /Korpora] oder (b) den Vergleich von mehreren [Texten / Korpora] oder (c) beides?
 
2.2. Welche Arbeits- und Analyseschritte leistet das Tool? Welcher Art sind sie (automatisch/händisch)? Ist ein Interface vorhanden? Welche Ausgabedaten werden generiert? Sind
 
diese mit anderen Programmen kompatibel?
 
2.2.1. Automatische oder händische Arbeitsschritte:  z.B. Parsing, Lemmatisierung, POS-tagging, Erfassung der syntaktischen Struktur (Tree Tagger), semantisches Tagging …
 
2.2.2. Analyseschritte: z.B. Frequenzanalyse, Kookurenzanalyse, Keyness-Analyse, Kohärenzanalyse, Valenzanalyse, Intensitätsanalyse, Kontingenzanalyse, Sentiment-Analysis, Autorschaftsidentifikation und Textähnlichkeitsmessung, Genre- und Textsortenvergleich, Handlungsanalyse, Analyse der Erzählperspektive…
 
2.2.3. Programmoberfläche: Interface? Programmierkenntnisse nötig? Welcher Art? (Java, R etc.?)
 
2.2.4. Ausgabedaten: rohe Daten (z.B. Frequenzen, n-Gramme, Konkordanzen (Keyword in Context  - KWIC), z-score, log-likelihood Werte, chi-square Werte), Visualisierungen (Frequenzen, story plot etc.), Datenformat (pdf, xml, txt etc.) … 
 
 
 
 
== '''3. Dateneinspeisung''' ==
 
 
3.1. Welches Format müssen die Eingabetexte haben? (z.B. Dateiendung). Können Datensätze hochgeladen werden?
 
3.2. Wird ein Metadaten-Markup verwendet? Wenn ja, welches? (z.B. Dublin Core, simple (DC), Text Encoding Initiative (TEI))
 
3.3. Leistet das Tool Hilfestellung bei der Erstellung von eigenen Korpora nach bestimmten Kriterien? Wenn ja, welche?
 
3.4. Sind vor-annotierte Texte nötig? Wenn ja, welche Art der Annotation?
 
3.5. Dürfen die Texte eine gewisse Größe (MB/GB) nicht überschreiten?
 
3.6. Urheberrecht der Texte?
 
3.7. Können Einzeltexte eingespeist/hochgeladen werden oder größere Datensätze?
 
3.8. Ist Zugriff auf ein Referenzkorpus ‚eingebaut‘? Wenn ja, auf welche/s?
 
 
 
== '''4. Benutzerfreundlichkeit und Transparenz''' ==
 
 
4.1. Wer ist die Zielgruppe?
 
4.2. Ist das Tool für Neueinsteiger auf dem Gebiet nutzbar?
 
4.3. Ist ein (leicht zugängliches) Interface vorhanden oder sind Programmierkenntnisse erforderlich? Wenn Interface: sind kreative Anfragen etc. möglich?
 
4.4. Gibt es ein ausführlichen Glossar, ein Manual, eine (interaktive) Hilfe, Tutorials etc.?
 
4.5. Transparenz: Wie transparent wird das „Innenleben“ des Tools geschildert? (Algorithmen, Programm-Details, Zuverlässigkeit, Bugs etc.)
 
 
 
== '''5. Welche Probleme (können) entstehen?''' ==
 
 
5.1. Zeitaufwand (Vorbereitung und tatsächliche Bearbeitung automatisch vs. händisch)
 
5.2. Interpretationsspielraum der Ergebnisse
 
5.3. Zuverlässigkeit der Ergebnisse
 
5.4. Man kann mit unterschiedlichen Tools unterschiedliche Hypothesen testen / Analysen durchführen (manche also auch nicht)
 
5.5. Kommentar: Generell sind oberflächenstrukturelle Fragen besser für quantitativ arbeitende Tools geeignet, da solche Phänomene leichter zu operationalisieren und als Indikatoren messbar sind. Komplexere Phänomene (Spannung, Erzählperspektive, Ironie etc.) erfordern tendenziell mehr Vorarbeit und händischem Aufwand. Andererseits zwingt die Konzeptualisierung und Operationalisierung die Forschenden auch zu größerer konzeptueller Schärfe und Konsistenz.
 
5.6. ... (siehe Literatur, z.B. Rommels Text)
 
 
 
== '''6. Beispielanwendung ''' ==
 
 
(mit Hypothese/Forschungsfrage, Diskussion und Fazit)
 

Aktuelle Version vom 7. Februar 2012, 11:52 Uhr