Über die letzten zwei Monate hinweg habe ich mal wieder intensiv mit XSLT gerungen, um ein (mir) neues Korpusformat in ein anderes zu überführen. Syntaktische Annotation steckt voller Fußangeln, gerade fürs Deutsche, und daher war ich immer heilfroh, in den Datenproben schön komplizierte Beispielsätze zu finden, an denen sich trefflich testen ließ, ob mein Konvertierstylesheet wirklich funktionierte. Insbesondere drei Sätze aus der Märkischen Allgemeinen Zeitung (das Korpus kommt aus Potsdam) sind mir richtig ans Herz gewachsen.
Was haben wir nicht alles zusammen durchgemacht, liebe Sätze! Was haben verbuggte frühe Versionen meines Stylesheets eure Syntax verstümmelt, wie verzweifelt habe ich manchmal nach den Fehlern gesucht! Wo für normale glatte Sätze ohne Extravaganzen alles schon zu laufen schien, wart ihr unbestechlich und habt die Unvollkommenheit der Konvertierung entlarvt! Heute stelle ich euch der Öffentlichkeit vor:
Doch wo und wer sind sie?
Das wird im Potsdamer Korpus gewissermaßen als „Doch wo sind sie und doch wer sind sie?“ analysiert, wobei statt der roten Teile durch „secondary edges“ die blauen ein zweites Mal in den syntaktischen Baum eingebunden werden. Eine wunderhübsche symmetrische Konstruktion.
Die jungen Autoren wollen nur noch gute Bücher schreiben und behaupten nicht, dass sie dem Kanzler Ratschläge erteilen können, die besser sind als die von Normalbürgern.
In der messerscharfen Potsdamer Analyse hat dieser Satz zwei unterbrochene Konstituenten, wobei eine („besser (…) als die von Normalbürgern“) in der anderen („Ratschläge (…), die besser sind als die von Normalbürgern“) steckt. Schon eine ganz ordentliche Messlatte.
Vielleicht wird ja der abgerundete Bonbonpreis durch den aufgerundeten Schokoladenpreis wieder wettgemacht.
Auch der Sprung von zweiteiligen zu dreiteiligen Konstituenten war nicht ganz trivial. Und inhaltlich gefällt mir dieser Satz besonders gut.
Abgesehen von den Bugs, die sich in XSLT ob der sadistischen Syntax leicht einschleichen: Mit welchem XSLT-Prozessor hast Du gearbeitet und wie schnell ist Dir der Speicher ausgegangen? ;-)
Saxon8B (ich kann kein XSLT 1.0). Den Speicher gesprengt haben mir vor allem die Messages, die ich fürs Entlausen ausgeben wollte… :)