Hier gibt es verschiedene Möglichkeiten, von denen im Folgenden zwei genannt werden können.

Die Universität Leipzig entwickelt unter dem Namen „TEI-Integrator“ ein Programm, welches aus einem xml-Ausgangstext (halb)automatisch Metadaten und relevante Textdaten extrahiert und diese sowohl in das Virtual Language Observatory (VLO) von CLARIN-D überführt als auch als XML/TEI abspeichert.

Das CLARIN-D Zentrum der BBAW bietet über das dort angesiedelte Deutsche Textarchiv (DTA) das Modul DTA-Erweiterungen (DTAE) an. Mit dem DTAE-Modul können historische Texte, die in anderen Projektkontexten digitalisiert wurden, dem DTA-Kernkorpus angelagert werden, um so die Textbasis für ein Referenzkorpus des historischen Neuhochdeutschen (Zeitraum ~1650-~1900) zu schaffen. Mit DTAE verbunden ist ein Workflow, um die zur Verfügung gestellten Texte so aufzubereiten, dass sie DTA- und somit CLARIN-kompatibel sind. Die Texte werden dann zusammen mit allen anderen DTA-Korpustexten in CLARIN verfügbar gemacht. Falls Sie in diesem Rahmen Ihre Texte verfügbar machen wollen, wenden Sie sich bitte an das DTA-Team (BBAW, Berlin, dta@bbaw.de).