Nachhaltigkeit

Ein Schwank aus meinem Berufsleben: Ein linguistisches Korpus ist eine Sammlung von Texten bzw. Transkriptionen gesprochener Sprache, die zusammengestellt wurde, um daran Sprache(n) zu erforschen. Zu so einem Korpus gehören üblicherweise nicht nur die Texte/Transkriptionen selbst, sondern auch Annotation (Angaben zu Wortarten, syntaktischer Struktur, Betonung, Akzent und was weiß ich) und eine Menge Metadaten, d.h.: Wie heißt das Korpus, wer hat es wann zusammengestellt, wo, wie und wann wurden die Daten erhoben? 1969 in einem togolesischen Dorf oder 1984 in einem Leipziger Sprachlabor? Will man diese Metadaten so aufbewahren, dass Linguisten auch noch in zehn Jahren vernünftig damit arbeiten können, ist man gut beraten, nicht einfach „Deutschland“ oder „Nordkorea“ zu schreiben, weil sich Grenzen, Namen und Existenzen von Staaten ja alleweil ändern. Eine Möglichkeit, den Ort der Datenerhebung eindeutig festzuhalten, wären geografische Koordinaten. Will man allerdings die Metadaten so aufbewahren, dass Linguisten auch noch in tausend Jahren vernünftig damit arbeiten können, reicht auch das nicht, weil: Kontinentaldrift! Zum Glück gibt es auch für die Zeitachse standardisierte Koordinatensysteme.

Ein Gedanke zu „Nachhaltigkeit

  1. DrNI

    Die Kontinentaldrift kann man ja messen und beobachten (ich vermute, daß das auch getan wir). Dann kann man hinterher zurückrechnen, wo der Aufzeichnungsort gelegen haben muß. Wenn allerdings in 4000 Jahren Archäologen deine XML-Datei ausgraben, dann bleibt es fragwürdig, ob die Drift die ganze Zeit aufgezeichnet wurde und ob die Daten die 7 atomaren Weltkriege bis dahin überstanden haben werden.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert