Kategorien
Computerlinguistik Geistesleben Sprache

Was man nicht sagt (2) – Wörter der Empörungsindustrie

Was bisher geschah: Was man nicht sagt

Als Sprachwissenschaftler muss ich meine Sprachkritik ja irgendwie verbrämen, damit ich mir nicht vorwerfen muss, ganz unwissenschaftlich den Leuten vorschreiben zu wollen, wie sie gefälligst nicht zu reden haben. Als Computerlinguist stehen mir da zusätzliche Summwörter zum Verbrämen zur Verfügung, stellen wir das Folgende also unter die Überschrift:

Bullshit Mining

Soll heißen: Sollte jemand einmal ein Programm entwickeln wollen, das Texte analysiert und die Stellen markiert, wo mit hoher Wahrscheinlichkeit Scheiße gelabert wird, könnte sich dieses unter anderem auf die Wortliste stützen, die ich in diesem und folgenden Beiträgen zusammenzutragen gedenke. Heute geht es um Wörter und Multiwörter, die in der Empörungsindustrie Verwendung finden – da, wo sich über abweichende Meinungen und Geschmäcker echauffiert wird, als handele es sich um Kapitalverbrechen.

„Dieser Film ist eine Schande für die gesamte französische Filmindustrie!“, sagte laut Max Goldt mal jemand über Die fabelhafte Welt der Amélie. Die Meinung allein verrät schon Hartherzigkeit, und dann erst die Ausdrucksweise! Wie schon bei meinen Ausführungen zu dem Wort Kinderschänder geoffenbart, habe ich für Wertesysteme, in denen die böse Tat eines Menschen unter dem Label „Schande“ an einem anderen Menschen klebenbleibt, nun ja… sehr wenig übrig. Ebenso wenig für sprachliche Relikte dieser Wertesysteme.

„Das ist geschmacklos!“ Das Wort Geschmack bezeichnet individuelle ästhetische Präferenzen, oder? In der daraus abzuleitenden Bedeutung „ästhetisch völlig indifferent“ wird geschmacklos aber nie verwendet, sondern im harmloseren Fall um für schlechter erachtete ästhetische Präferenzen abzuurteilen. Das kann ich noch akzeptieren, denn auch ich gebe mich lustvoll der Hybris hin, meinen Geschmack für besser als den vieler zu halten. Mit dem Wort geschmacklos gehe ich trotzdem sehr vorsichtig um, weil es Objektivität suggeriert, als gäbe es da eine gemeinhin akzeptierte Geschmackslehre, anhand derer sich alles testen ließe. Warum nicht das Kind bei einem subjektiven Namen nennen und hässlich sagen? Es muss schon um eine sehr spezielle Art von Hässlichkeit gehen, etwa die einer mit pinken und roten Kätzchen und Herzen gemusterten Tapete, bevor ich das Wort geschmacklos verwenden würde.

Das war jetzt aber nur Vorgeplänkel, denn es geht ja um die Empörungsindustrie. (Industrie, weil Gewinnabsicht: Zur Empörungsindustrie gehört jeder, der mit Empörung Wählerstimmen, Auflage oder Internetdiskussionen gewinnen will. Für den folgenden Punkt ist es nämlich wichtig, Internetforennutzer mithineindefiniert zu haben.) Die benutzt das Wort geschmacklos, wenn es um Witze und Vergleiche geht, die man nicht machen darf, weil man damit Empfindlichkeiten verletzt (hat immer irgendwas mit Hitler zu tun). Es geht dann also nicht um eine ästhetische, sondern um eine moralische Frage. Und da ist das Wort geschmacklos ob seiner Schwammigkeit noch viel weniger geeignet: Es ist eine Totschlagvokabel, die von der Suche nach dem wahren Problem ablenken soll – in vielen Fällen ist das wahre Problem nämlich Dummheit oder unangebrachte Dünnfelligkeit des Beleidigten.

„Das ist nicht witzig!“ Wird auf „geschmacklose“ (s.o.) Witze angewandt, als hätte die politische Korrektheit irgendeinen Einfluss auf die Witzigkeit. Wenn jemand einen anderen Humor hat oder bei heiklen Themen so leicht Klöße im Hals bekommt, dass das Lachen steckenbleibt, ist das was anderes. Bei allen anderen wird höchstens aus „Hahaha“ „Hohoho“ oder „Huhuhu“, aber das Zwerchfell spannt nicht minder.

6 Antworten auf „Was man nicht sagt (2) – Wörter der Empörungsindustrie“

Eigentlich eine gute Idee, aber die Ausführung der Buzzwords (man möchte fast den Begriff Stoppwörter missbrauchen) ist noch etwas schwach. Vielleicht hilft hier die Analyse von Mitschnitten der Bundestagsdebatten, die ja auf Phoenix ausgestrahlt werden.

Funktioniert das so ähnlich wie Newstin – ein mehrsprachiger, global verschlagwortender Feed-Fresser, der bei jedem Eintrag auch noch „Sentiment Detection“ betreibt: „Sentiment Detection ist ein Tool, mit dem wir die Grundstimmung eines Artikels bestimmen. Mit Hilfe dieses Tools kann man erfahren, ob der Eintrag in einem positiven, negativen oder neutralem Ton geschrieben ist.“

Wird durch eine grüne/rote Skala angezeigt. Hier mein Feed, den ich neulich dort entdeckt habe, und was der Algorithmus an „Sentiment“ zuordnet:

http://www.newstin.de/show-source.a?source=herr-rau.de

Auch noch entwicklungsfähig, der Algorithmus.

Wie die Sentiment Detection bei Newstin funktioniert, kann ich nur raten. Ich tippe auf ein banales Verfahren, das sich auf nicht viel mehr als „lexical cues“ (einzelne Wörter, denen – eventuell in unterschiedlichen Graden – Positiv- und Negativpunkte zugeordnet sind) und vielleicht noch irgendwelche statistischen Gewichtungen stützt. Insofern ähnlich wie das oben skizzierte „Bullshit Mining“.

Eine Kommilitonin von mir beschäftigt sich schon länger mit „Sentiment Analysis“ – etwas spannender, da hier interessiert, wo gut oder schlecht über was geredet wird. Marketingabteilungen können damit Foren, Blogs und andere Webinhalte durchforsten und sich rot-grüne Tortendiagramme für einzelne Firmen- und Produktnamen auf den Schirm holen. Da muss man dann – schätze ich – schon zuminest ein bisschen die Syntax parsen, damit man z.B. weiß, welches Adjektiv sich auf welches Produkt bezieht und ob nicht eine Negation den Sinn verkehrt.

Es ist bei Sentiment Analysis leicht vorstellbar, wie begrenzt ein Keyword-Ansatz sein muss. Schon allein wegen der Wortbedeutung im Kontext.

„Das Musikstück ist komplex.“
Damit ist das Musikstück noch nicht schlecht.

„Die Benutzeroberfläche ist komplex.“
Das will niemand, also ist es schlecht.

„Die Benutzeroberfläche ist komplex. Nach kurzer Eingewöhnung kommt man aber schneller voran als bei vielen anderen Produkten.“
Also doch nicht schlecht, aber wie stellt man das fest? (Im Beispiel dann übrigens mit Sprung über die Satzgrenze, was in die Abteilung Diskurs fällt und nicht mehr reine Syntax ist.)

Alles nicht so einfach. Man kann natürlich Pi*Daumen rechnen und mit statistischen Verfahren draufballern. Solange am Ende noch grob das richtige rauskommt, wäre dieser Ansatz zwar „verständnislos“ aber erfolgreich.

Sehr interessant, worauf man bei der Suche nach Wortlisten für Sentiment Detection im eigenen Praktikum so stößt… :- )