Ich verwalte mehrere MySQL-Datenbanken, die ich in letzter Zeit nach und nach von der veralteten Zeichenkodierung Latin 1 auf das neue UTF-8 umgestellt habe. Dabei gilt es auch die Kollationen für einzelne Tabellenspalten auszuwählen, das sind Regeln, nach denen Stichwörter bei Bedarf sortiert werden (wie Nachnamen in einem Telefonbuch). Merkwürdig ist, dass MySQL Kollationen für alle möglichen Sprachen kennt, aber nicht für die deutsche; es ist also zum Beispiel utf8_swedish_ci
vorhanden, aber kein utf8_german_ci
. Zuerst war ich paralysiert von dieser Lücke. Im Web wurde verschiedentlich empfohlen, stattdessen utf8_czech_ci
zu verwenden. Warum ausgerechnet die, wurde aber nicht erklärt. Schließlich konnte ich mich doch noch frohen Herzens dazu entschließen, als mir nämlich einfiel, dass ich ein T-Shirt mit der Aufschrift „Schön ist, was tschechisch ist“ besitze und die Verwendung der tschechischen Kollation daher nur konsequent ist.
Okay, jetzt weiß ich’s auch: utf8_unicode_ci ist DIE Kollation für Deutsch und Französisch.