In der Ökologie unterscheidet man zwischen abiotischen und biotischen Faktoren, denen Organismen ausgesetzt sind und die ihr Überleben beeinflussen. Zu den abiotischen Faktoren zählen z.B. Temperatur, Niederschlag, Mineralien, Sauerstoff und Kohlenstoffdioxid, Chemikalien, Strahlung, Erdbeben, Sintfluten, Meteoritenhagel und Killerroboter, also alles, was auf unbelebter Materie basiert. Neben Fressfeinden, Nahrungsangebot, Parasiten, Krankheitserregern und konkurrierenden Organismen zählen dagegen auch Kohle und Spuk zu den biotischen Faktoren, da sie ursprünglich auf belebter Materie basieren.
Translating with Semantic Representations
The beauty of the topic I’ve chosen for my B.A. thesis lies in the fact that it is about Machine Translation (MT), the prototypical application of Computational Linguistics (CL), relatively easy to explain yet incorporating many subdisciplines of CL. When I started studying CL three years ago, I told my grandparents about MT, now I can tell them I’m actually doing it.
Of course, what I’m doing compares to state-of-the-art MT systems like a lever does to a particle accelerator. My thesis will be about devising and implementing, in Prolog, a program that translates a certain class of English sentences, like (1a), to correct and elegant German counterparts, like (1b). Crucially, in generating the German sentence, no other information about the English input will be used than the semantic first-order logical formulae, as in (2), derived from the input using BB1, the software accompanying Blackburn’s and Bos‘ textbook. (Since the English and the German sentence both carry the same ambiguity, both of them are associated with two logical formulae, (2a) and (2b)).
(1a) Every boxer loves a woman.
(1b) Jeder Boxer liebt eine Frau.
(2a) ∀x(boxer(x)→∃y(woman(y)∧love(x,y)))
(2b) ∃x(woman(x)∧∀y(boxer(y)→love(y,x)))
In other words, I use these simple logical formulae as an interlingua, leaving parsing and „understanding“ to (a possibly marginally extended version of) the existing system by Blackburn and Bos and focussing my efforts on generating German sentences. Nested quantification and negation, predicates best expressed as relative clauses, nouns, verbs or adjectives, and anaphoric expressions, among other things, will make this quite interesting.
Right now, I am concerned with defining my approach precisely and describing the place it has among other approaches from the literature. Today I collected dimensions along which Natural Language Generation (NLG) and MT systems can be positioned. I hope to post something about them tomorrow, before leaving for a break on the bicycle.
Here’s the title of my B.A. thesis: Problems of Generating German from Logical Formulae in Automatic Translation from English to German.
Premium-Wörterwolken
DrNI berichtete neulich über Wordle, einen Dienst, in den man Texte oben reinwirft und wo unten eine Wörterwolke rauskommt. Ein Wort ist umso größer, je häufiger es im eingeworfenen Material vorkommt. Mit Farbschemata, Schriftarten und Textrichtungen lässt sich trefflich spielen.
Um das ästhetische Erlebnis zu erhalten, das man sich wünscht, muss man aber an mehr drehen als nur an den Schaltern, die Wordle bereitstellt. Das erlebte ich neulich, als ich den Dienst benutzte, um ein Geburtstagsgeschenk zu erstellen, ein Poster zum Thema „Vorhang“. Eine Wortwolke aus lauter Begriffen, die sich um den Begriff „Vorhang“ ranken, das war die Idee. Als Rohmaterial verwendete ich frei zugängliche Texte zu dem Thema, angefangen mit den wikipädischen Artikeln Vorhang und Bühnenvorhang (ich wollte begriffliche Ranken hauptsächlich um den Theatervorhang).
Wichtige Faktoren für die Schönheit einer Wörterwolke sind ihre Größe und die relative Größe der Wörter zueinander. Eine bunte Mischung aus vielen kleinen (seltenen) und einigen großen (häufigen) Wörtern ist wünschenswert, allzu starke Ausreißer allerdings nicht – ein graues Rauschen aus Mikroschrift ist nicht so hübsch, und auch nicht, wenn der zentrale Begriff „Vorhang“ wie ein Balken durch die ganze Wolke geht und die Hälfte des Platzes einnimmt. Ich entschloss mich daher, ihn komplett aus den Eingabetexten zu entfernen. Machte das ganze auch rätselhafter – man würde raten können, worum es überhaupt gehe.
Dann war ich mit den Wörtern selbst unzufrieden. Der Bühnenvorhang-Artikel ist durchsetzt mit Fachbegriffen der trockensten Sorte, zumeist aus dem Bereiche des Brandschutzes, und eine solche Wolke ist uncharmant und an einen, der durch Brandschutzvorschriften traumatisiert ist, unverschenkbar. Raus also mit dem „Bühnenvorhang“-Artikel! Doch wodurch ihn ersetzen? Die Begriffsklärung „Vorhang“ allein ergab nur ein kümmerliches Wölkchen, für eine Briefmarke vielleicht geeignet, aber nicht für ein Poster.
Durch Herumprobieren fand ich dann heraus, dass Zeitungstextkonkordanzen wie die des Wortschatz-Portals der Universität Leipzig (man gibt einen Begriff ein und kriegt u.a. Massen von Beispielen aus Online-Medien) unter ästhetischen Gesichtspunkten vortrefflich geeignet sind. Die Sprache ist dicht, durchsetzt mit bedeutungsstarken Wörtern und Metaphern und unvermuteten Zusammenhängen und durch technische Verarbeitungsfehler produzierten Artefakten wie „Cocogeschmust“. So wünsche ich mir den Zufall, wenn er künstlerisch für mich arbeiten soll! Genau so hatte ich mir das vorgestellt:
Träume aufschreiben
Ich habe es eine Zeitlang getan,
gesteht Max Goldt in seinem Tagebucheintrag „Daß sich Träume an- und abstellen lassen“ („Wenn man einen weißen Anzug anhat“, Rowohlt 2002),
empfand die aufgeschriebenen Träume beim späteren Lesen aber als albern und ausgedacht klingend und dachte dann, wenn sie eh ausgedacht klingen, braucht man sich nicht schlaftrunken an den Schreibtisch zu zwingen, sondern kann sich im wachen Zustand, wenn man z. B. eh gerade am Schreibtisch sitzt, wirklich welche ausdenken: Ich kletterte auf eine Linde, und oben im Baum saß Frau Borowka, die verhaßte Retusche-Lehrerin aus meiner abgebrochenen Fotografenausbildung. Die gibt mir ein altes Hochzeitsfoto. (…) Das Foto ist natürlich stark bekleckert, denn Retuschelehrerinnen geben einem immer extra bekleckerte Fotos, da man die Kleckse ja wegretuschieren soll (…). Ich steige von der Linde runter, schaue noch einmal hoch und bemerke, daß die Linde gar keine Linde ist, sondern der Zehnmetersprungturm im Freibad von Göttingen-Weende.
Das klingt in der Tat ausgedacht – der Retuschelehrerinnensyllogismus ist viel zu logisch für einen Traum. Was in Träumen als logisch dargestellt wird, sind einem Wachen unergründliche Schlüsse. Und das mit dem Zehnmetersprungturm ist eine schwache Nachmache in Träumen üblicherweise stattfindender Verwandlungen von Personen, Dingen und Orten. Authentischer hätte es geklungen, wenn er von dem Baum schon als von einem Sprungturm heruntergeklettert oder -gesprungen wäre. Die These, dass man sich Träume genausogut ausdenken kann, bricht dann im Folgenden zusammen, als Goldt einen echten Traum schildert:
Ich war in einem Gebäude zugange, das etwas mit einer autoritären Sekte zu tun hatte. Es gab ein Gerücht, daß man irgendwo in dem Gebäude zur Willensbetäubung „besprüht“ wird.
Wunderbar! Exzellent! Das ist typisch Traum! „Gerücht“, das steht gewiss für das diffuse Wissen unbekannter Quelle, das man in Träumen hat, und dann diese originell deplatzierte Terminologie wie „besprüht“! An so was erkennt man Träume! Ein wunderbares Beispiel ist auch Markus Riexingers Text „Ein spannendes Fußballspiel“, der in der Rubrik „Vom Fachmann für Kenner“ in der Titanic veröffentlicht wurde.
Sollte ich einmal den Nerv entwickeln, Beispiele aus der eigenen Erfahrung abzutippen, werden Sie, liebe Leser, davon erfahren.
AStA-Wahlen
Die Ergebnisse der diesjährigen AStA-Wahlen an der Universität Tübingen sind da, und hier ist meine Dienstleistung für alle, die sich auch fragen, was sich seit dem letzten Jahr geändert hat:
| Platz | 2007 | 2008 | ||
|---|---|---|---|---|
|
Wahlbeteiligung |
17,9% |
Wahlbeteiligung |
15% |
|
| 1 |
Grüne |
23,9% |
Liste für die Fachschaften/Fachschaften-Vollversammlung |
26,5% |
| 2 |
Liste |
21,1% |
Grüne Hochschulgruppe (GHG) |
24,3% |
| 3 |
Liste |
19,5% |
Liste |
17,7% |
| 4 |
JUSO-Hochschulgruppe |
14,2% |
Juso-Hochschulgruppe |
14,6% |
| 5 |
RCDS |
10,7% |
RCDS |
11,8% |
| 6 |
|
6,5% |
LHG |
5,1% |
| 7 |
UTE-Unabhängig |
4,1% |
|
|
Quellen: Amtliche Bekanntmachungen der Universität Tübingen,
Jahrgang 33 – Nr. 7 – 25.06.2007
Jahrgang 34 – Nr. 7 – 07.07.2008
Ein kleines Donnerwetter
Auf der offiziellen deutschen Website zu dem wunderbaren, mit keinem Raster zu fassenden, unbedingt empfehlenswerten schwedischen Film Das jüngste Gewitter steht folgende Inhaltsangabe:
Da ist beispielsweise die junge Frau, die sich die Hochzeit mit einem begehrenswerten, aber unerreichbaren Rockmusiker erträumt. Oder der Psychologe, der es nicht mehr erträgt, seine Patienten mit ihren eingebildeten Krankheiten zu behandeln. Oder der Frisör, der sich an einem ungehobelten Kunden mit einer Skinheadfrisur rächt. Oder der Familienvater, der sich an einer langen Tafel am Tischtucktrick versucht und zum Tode auf dem elektrischen Stuhl verurteilt wird.
Der „unerreichbare Rockmusiker“ ist Gitarrist und Sänger einer Schülerband, den die junge Frau in der Stammkneipe anspricht. Der „Psychologe“ ist ein Psychiater und es sind nicht die eingebildeten Krankheiten, die er nicht mehr erträgt, sondern die Schlechtigkeit seiner Patienten und die Sinnlosigkeit ihres Wunsches nach Glück. Die Glatze ist nicht die Rache, sondern ein Versöhnungsangebot des Frisörs, nachdem er – das war die Rache – seinem ungehobelten Kunden eine kahle Schneise über den Kopf rasiert hat. Und dass der Mann mit dem Tischtuchtrick ein Familienvater sei, kommt im Film nicht vor.
Es ist nicht leicht, irgendetwas über den Film zu schreiben, das ihm gerecht wird. Eine Inhaltsangabe, in der jeder Satz sachlich falsch ist, ist aber auch eine Leistung.
TaCoS 2009
Vielleicht bin ich der erste, der das online bringt: Die nächste TaCoS wird aller Voraussicht nach in Heidelberg stattfinden. Vorfreude! Die TaCoS 2008 ist für mich wegen eines wichtigen Termins schon vorbei, war aber wunderschön. Ich habe 17 Vorträge gehört, einen gemeinsam mit Johannes gehalten, interessante Menschen, zwei neue Anglizismen und das Spiel „Teamwork“ kennengelernt, zu dem folgende Verschärfung zu empfehlen ist: Die Beschreibung jedes Begriffs muss mit einem Derivat des vorhergehenden Begriffs beginnen.
Reliefs
Ich war im März in der Toskana. Im Museo Leonardino in Vinci faszinierte mich eine Schautafel über die 21 untersten sechseckigen Reliefs am Florenzer Campanile. Diese Reliefs stammen aus dem 14. Jahrhundert und zeigen menschliche Tätigkeiten. Interssanterweise sind diese nicht, wie damals (und heute) üblich, nach „niederen“ (landwirtschaftlichen und handwerklichen) Arbeiten und „höheren“ Künsten (einschließlich Wissenschaften) getrennt – sondern all das steht nebeneinander. Noch interessantererweise beginnen diese „menschlichen Tätigkeiten“ mit der Erschaffung von Adam und der Erschaffung von Eva. Auf einer Ebene ist Menschenmachen natürlich eine menschliche Tätigkeit. Auf einer anderen Ebene ließen mich diese beiden Reliefs an einen schöpferischen Menschheitstraum denken (klonen, Chimären, Golem und so weiter). Plausibler kommt es mir allerdings vor, dass die Künstler versucht haben, die Aufstellung der Handwerke und Künste gleichzeitig eine chronologische Illustration zur Bibel sein zu lassen – grob gesagt: Erst Erschaffung, dann Ackerbau, dann Rhetorik. Der Architekt taucht auf zwei Reliefs auf: Einmal als Planer am Schreibtisch, einmal als Baumeister auf der Baustelle. Im geisteswissenschaftlichen Bereich wurde dem Naturalismus der Darstellung die klare Erkennbarkeit der einzelnen Disziplinen anscheinend vorgezogen – so hätte ich Rhetorik von Grammatik (im Bild) kaum unterscheiden können. Das Relief zur Grammatik gefällt mir aber gut, weil es die Sprengkraft von Sprachnormen so lebendig darstellt. Gerne hätte ich es in das Logo der Gesellschaft zur Stärkung der Verben eingebauen, aber unglücklicherweise liegt es auf der Domseite des Campanile, die zudem durch biestige Gitter für Fotografen schlecht zugänglich ist. Oben sieht man das bescheidene Resultat meiner Bemühungen. Wer besseres Bildmaterial hat, melde sich! Wer lesen will, was Profis zu den Reliefs schreiben, kann zum Beispiel in Bluffton beginnen.
Kognitive Dissonanz
Wenn man a) sich für einen klugen Kopf hält und b) einen Job macht, der eigentlich sinnlos ist, dann besteht die Gefahr, dass man die kognitive Dissonanz dadurch verringert, dass man sich einredet, der Job sei gar nicht so sinnlos.
Herr Rau
Oh ja. Das kenne ich aus eigener Erfahrung.
The Quintet of the Astonished
von Bill Viola (siehe da) ist eins meiner Lieblingskunstwerke. Es handelt sich um ein Video von wenigen Sekunden, das durch Superzeitlupe auf ca. 15 Minuten Länge ausgedehnt wurde. Es zeigt eine Gruppe von Menschen, die irgendetwas mit heftigen Emotionen zu beobachten scheinen. Am Anfang dachte ich aufgrund der starren Haltung und der anhaltend verzerrten Gesichter an die Gram an einem Sterbebett. Oder war das eine langsamkeitsbedingte Täuschung? Als ich die Bewegungen weiter verfolgte, kam ich auf den Gedanken, das seien die Zuschauer eines Sportereignisses. Bill Viola selbst hatte anscheinend die Dornenkrönung im Sinn. So vielfältige Sichtweisen eröffnet The Quintet of the Astonished auf Anhieb. Jedenfalls wird es ab und zu im Fernsehen nachgestellt. Wenn nämlich bei der Wiederholung von Torchancen im Fußball die Trainerbank im Bild ist.

