Wenn Phrasenstrukturen von bislang unannotierten Texten analysiert werden sollen, ist eine Reihe von Arbeitsschritten notwendig:<p/> - Bestimmung der relevanten Charakteristika, nach denen die Phrasenstrukturen durchsucht werden<p/> - bestimmte Wortreihenfolgen, Wortarten, Syntax, Eigennamen, usw. <p/> - Automatische Annotation der Texte, die Sie durchsuchen möchten, in WebLicht.<p/> Hier muss man durch Ausprobieren die Werkzeuge finden, die zum einen gute Ergebnisse auf Ihren Daten liefern, das betrifft zum einen Satzgrenzen-Erkennung, Wortgrenzenerkennung, Wortarten, Eigennamen, ggf. Morphologie und Lemmas. Zum anderen muss der Parser, der die syntaktische Struktur annotiert, nicht nur möglichst korrekt sein, sondern gleichzeitig sollte sein theoretisches Modell die Strukturen, die Sie suchen, möglichst gut abbilden. <p/> Die in WebLicht annotierten Texte kann man im negra-export-Format exportieren und in das TIGERSearch-Abfragewerkzeug importieren. Darin kann man Suchanfragen erstellen, die mit möglichst gutem Recall und Precision die gesuchten Muster auffinden. <p/> Bei automatischer Annotation findet man nicht 100% aller Treffer, aber die Methode eignet sich gut für einen Überblick, eine quantitative Analyse und für das Finden neuer Muster. TIGERSearch erlaubt leider keinen direkten Export der Treffer.