Um einen Satzbauplan wie "Subjekt – Prädikat – direktes Objekt" in einem Text nachzuweisen, muss der Text mit grammatischen Funktionen ausgezeichnet ("annotiert") sein. Die Abfrage von topologischen Mustern verlangt eine entsprechende Annotation von topologischen Feldern.

Wenn Sie einen eigenen Text analysieren wollen, können Sie ihn in der WebLicht-Toolchain (https://weblicht.sfs.uni-tuebingen.de) mit den entsprechenden Annotationen anreichern. Genaueres dazu weiter unten.

1. Suche auf vorhanden Korpora.

Im CLARIN-D-Kontext gibt es auch Korpora, die mit dieser Art von Annotation bereits manuell ausgezeichnet sind:

- Grammatische Funktionen: Tiger , TüBa-D/Z

- Topologische Muster: TüBa-D/Z

TüBa-D/Z ist über den Webservice Tündra abfragbar. Sie können dort durch ihre Suchergebnisse browsen. Tündra ist angelehnt an das Suchtool TIGERSearch, das Sie sich plattformunabhängig lokal installieren können. TIGERSearch bietet zusätzlich zum Ergebnisbrowsen einfache Frequenzauflistungen und Download-Optionen.

- Tündra

- TIGERSearch (lokale Installation nötig)

- TüBa-D/Z

- Tiger Korpus: (Download über "License")

1.1 Beispielanfrage für topologische Muster Eine Beispielanfrage auf TüBa-D/Z (für Tündra und TIGERSearch), die Verbzweitsätze findet:

"Finde ein Vorfeld (VF), das unmitelbar einer linken Satzklammer (LK) vorangeht (und beide topologische Knoten werden unmittelbar vom selben Satzknoten (SIMPX) dominiert)"

#1:[cat="VF"].#2:[cat="LK"] & #0:[cat="SIMPX"] > #1 & #0 > #2

1.2 Beispielanfrage für Satzbauplan Satzbaupläne (grammatische Funktionen) sind auf TüBa-D/Z theoretisch abfragbar, erforden aber etwas komplexere Suchanfragen wegen der "intervenierenden" Knoten für topologische Felder. Im Tigerkorpus sind Satzbaupläne unmittelbarer abfragbar.

Eine Beispielanfrage für Satzbaupläne auf Tiger (momentan nur über TIGERSearch):

"Alle Sätze mit dem Satzbauplan Subjekt - Prädikat - Akkusativobjekt"

#0:[cat="S"]& #0 >SB #1:[] & #0 >HD #2:[] & #0 >OA #3:[] & #1 . #2 & #2 . #3 & arity (#0,3) (= Gesucht ist ein S-Knoten, der umittelbar drei andere Knoten dominiert, und zwar mit den Funktionen Subjekt (SB), Kopf (HD) und Akkusativobjekt (OA), wobei folgende unmittelbare Präzedenz zwischen den Töchtern besteht: SB vor HD vor OA. Die Stelligkeit (arity) von S ist auf drei beschränkt.)

2. Suche auf eigenen Texten (mit Vorverarbeitung)
Wenn Sie einen eigenen Text analysieren wollen, können Sie ihn mit der WebLicht-Toolchain (https://weblicht.sfs.uni-tuebingen.de) anreichern und anschließend in Weblicht selbst sichten und in Tündra oder TIGERSearch gezielt abfragen.

2.1. Syntaktische Vorverarbeitung
ierzu müssen Sie Ihren Text in WebLicht hochladen. WebLicht akzeptiert eine ganze Reihe von Input-Formaten (txt, pdf, doc, verschiedene xml-Formate).

2.1.1 Annotation von topologischen Feldern (und Konstituenten)
WebLicht-Einstellung: production Toolchain: - Text laden - SfS To TCF Converter - IMS Tokenizer - IMS TreeTagger - SfS Berkley Parser => Ausgabe ähnlich wie TüBa-D/Z (ohne grammatisch Funktionen)

2.1.2 Annotation von Konstituenten und Funktionen
WebLicht-Einstellung: production Toolchain: - Text laden - SfS To TCF Converter - IMS Tokenizer - IMS TreeTagger - IMS Constituent Parser => Ausgabe ähnlich wie das Tigerkorpus (ABER: Konstituenten und Funktion als ein kombiniertes Label, z.B. NP-SB)

2.2 Sichtung der annotierten Daten
Die automatische Analysen ähneln den Analysen in den manuell annotierten Korproa (Tiger, TüBA-D/Z), sind aber bis zu einem gewissen Grad fehlerbehaftet. Als Grundlage für eine Datensichtung sind sie aber sicher hilfreich.

2.2.1 Browsen der Ergebnisse in WebLicht
ine einfache (grafische) Sichtung ohne Suchfunktion bietet Weblicht über die "Visualize Results"-Funktion.

2.2.2 (Online-)Abfrage der Ergebnisse in Tündra
Hierzu müssen Sie das Ergebnis des Parsens über die Download -Funktion in WebLicht herunterladen und anschließend in Tündra hochladen (http://weblicht.sfs.uni-tuebingen.de/weblichtwiki/index.php/Tundra). => gezielte Suchanfragen möglich (siehe oben)

2.2.3 Abfrage der Ergebnisse in TIGERSearch
TIGERSearch muss lokale suf Ihrem Rechner installiert sein (http://www.wolfganglezius.de/doku.php?id=cl:tigersearch (Ein neuer Webauftritt am IMS Stuttgart ist in Arbeit)). Um Ihre Daten in TIGERSearch einlesen zu können müssen Sie in Weblicht einen weiteren Vorverarbeitungsschritt an das Ende der oben genannten Toolchains ergänzen: - SfS Convert to Negra Dann Download des Konvertierungsergebnisses und Upload in TIGERSearch (über TIGERRegistry: Negra-Filter). => gezielte Suchanfrage, Frequenzauflistungen und Download der Suchergebnisse möglich