Hällo Wörld!

oder

Immer dieser ඀rger mit Umlauten

oder

Was Sie nie über Umlaute wissen wollten (aber eigentlich wissen sollten)

Martin Neitzel
Gärtner Datensysteme, Braunschweig
neitzel@marshlabs.gaertner.de

Einsteiger-Forum: 25-30min Vortrag + 25 Minuten Diskussion

Abstract:

Welche Puzzle-Teile müssen bei Linux für korrekte Umlaute alles richtig zusammenpassen? Wie überprüfe ich diese Einstellungen, und wie identifiziere ich "kaputte" Texte? Wie mache ich kaputte Texte wieder heil?

Dieser Vortrag gibt Orientierung, wie man sich am besten durch den Dschungel der Encodings, Locales und Terminal-Einstellungen durchschlägt.

Shortpaper:

Umlaute gehen im Rechner kaputt, seitdem sie dort überhaupt gemacht werden können. Auch wenn die Einladung zur Geburtstagsfeier auf dem Bildschirm nach viel Gestaltung endlich perfekt erscheint: auf dem Drucker, in der verschickten Email, oder im Blog kann alles plötzlich etwas hässlicher aussehen.

Ich möchte insbesondere den Anwendern und Nicht-Technikern ohne Vorkenntnisse möglichst verständlich erklären, wie der Umgang mit Zeichensätzen von der Theorie her bei Linux sein sollte, und was praktisch dabei aber gelegentlich schief läuft.

In der Vortrags-Hälfte werde ich zeigen und erklären:

  1. Wie die Umlaute in den Rechner kommen.
  2. Eine kurze Übersicht über verschiedene Kodierungen, die generell in Gebrauch sind
  3. Was "locales" sind, wie man sich für eine entscheidet, und was man dann alles dafür braucht und machen muss.
  4. Wie man weiterkommt, wenn andere Leute (bspw. die Online-Bank oder der Drucker-Hersteller) andere Kodierungen viel besser finden.

Dabei werde ich insgesamt ca. sechs (einfache) Linux-Kommandos zeigen.

Die Teilnehmer sollten hinterher fähig sein, die Einstellungen des eigenen Rechners anhand einer Checkliste herauszufinden, auf Korrektheit hin zu überprüfen und ggf. zu korrigieren. Auf dieser Grundlage können dann auch "andere" Texte von Fremdsystemen ordentlich uebernommen und konvertiert werden.

In der Diskussions-Hälfte möchte ich in erster Linie auf Fragen zum praktischen Einsatz eingehen:

Zum Referenten:

Martin Neitzel hat seine ersten Umlaute vor über 30 Jahren mit DIN-66003 und EBCDIC in die Rechner gekl|ppelt und m|chte eigentlich nicht mehr dahin zur}ck|||111!!

Seine Br\"otchen verdient er seit 20 Jahren als ISP in einem t\(:aglichen, endlosen, vergeblichen Kampf gegen PHP-Fuzzies, die gerne noch mal eine Extra-Schicht URL&&hyph;Encoding um UTF-Umlaute wickeln, bevor sie sie in eine LATIN1-Datenbank st඀pseln.