Die Annotation historischer und diachroner Primärdaten, insbesondere zum Zweck der Analyse von Grammatikalisierungsphänomenen, stellt hohe Anforderungen an die zu verwendenden Annotationsschemata.

Standardisierte und weitgehend adaptierte Tagsets wie das Stuttgart-Tübingen Tagset (STTS) basieren auf einer synchronen und gegenwartsbezogenen Beschreibung der Sprache. Eine Annotation mithilfe dieser Schemata würde also Hypothesen hinsichtlich des Grammatikalisierumgsgrades vorwegnehmen. Es empfiehlt sich daher, allgemeine und weitgehend zeitstabile Kategorien bei der Annotation der Daten zu verwenden. Eine mögliche Lösung ist beispielsweise, nur übergeordnete Kategorien des etablierten Tagsets zu verwenden, sich also auf einem allgemeineren Level an ihnen zu orientieren und so die Möglichkeit zu einer vergleichenden Analyse historischer und gegenwartssprachlicher Ressourcen zu schaffen.

Eine Suche nach verschiedenen Realisierungen von Umlauten wiederum, ist mithilfe einer Volltextsuche unter Verwendung Regulärer Ausdrücke ohne weiteres möglich, und erfordert daher keine Annotation. Bei stark normalisierten Transkriptionen, bei denen Informationen über verschiedene Realisierungen fehlen, ist eine solche Analyse hingegen nur möglich, wenn diese mit deren Facsimiles verknüpft werden, z. B., mithilfe des Text-Bild-Link-Editors, der Teil der Aufbereitungssoftware TextGrid Laboratory ist.