Die Beantwortung dieser Frage hängt von sehr vielen Faktoren ab.

Um nur einige zu nennen: Welche Modalitäten werden aufgezeichnet? Modalitäten, die sich mit Standard-Ausrüstung aufzeichnen lassen (Audio, Video) sind um Größenordnung preisgünstiger wie proprietäre Ausrüstungen (z.B. EMA, Ultraschall, 3D Point Capture, MRI, EPG, EEG, Eye-Tracking,...)

Erfordert das Aufnahme-Setting einen oder mehrere Aufnahmeleiter?

Braucht man für die Aufnahme spezielle Räumlichkeiten, z.B. Kontrollraum für Wizard-of-Oz Aufzeichnungen?

Wie aufwendig ist die Rekruitierung von Versuchspersonen?

Wie aufwendig ist die Nachbearbeitung? Zur Nachbearbeitung zählen: Synchronisierung von Modalitäten, Annotation, Metadatenerstellung.

Zur Vergleichbarkeit ist es sinnvoll, pro Sekunde Aufnahmezeit zu rechnen: Einfaches Telefonsprachkorpus mit gelesener Sprache und sehr einfacher Annotation (SpeechDat Standard ): ca. 1-2 EUR / sec Map-Task Aufnahme: Je zwei Versuchspersonen lösen per Sprachkommunikation eine Aufgabe, Verschriftung mit linguistischer Annotation (z.B. Verbmobil Standard): ca. 8-28 EUR / sec Multimodale Erfassung eines Mensch-Maschine-Dialogs, 8 Mikrophone, 2 Video, eine Infrarot-Kamera, Annotation nach Verbmobil-Standard, Annotation von Zeigegesten, Annotation von Emotionen: ca. 55 - 125 EUR / sec Multimodales Experiment mit Audio, Video, Elektromagnetische Artikulographie; Nachbereitung der 3D-Fleshpoints: ca. 250 EUR / sec