| |
|




|
|
|
 
|
|
 |  |  |  |
|
| |
|
|



















|
|
Die meisten kennen es. Aber die wenigsten machen sich ernsthaft Gedanken, wenn Umlaute in E-Mails in ganz putzigen Zeichen dargestellt werden. Auch das gute alte ß ist nicht wieder zu erkennen. Aber was soll's - der Inhalt ist aus dem Kontext zu verstehen. Mein Mailprogramm hat vielleicht einen schlechten Tag.
Software? Einen schlechten Tag? Es ist ja nicht so, dass sich mein Mail-Client mit einer E-Mail verkracht und wegen akuten Beziehungstresses Verständnisprobleme hat. Letztere müssen also einen anderen Grund haben.
Den gibt es. Und der hat auch wirklich mit Sprache zu tun:
Jeder Computer dieser Welt versteht im Grunde dieselbe Sprache. Nur das diese eben schwer artikulierbar ist. Kein Wunder, schließlich besteht sie nur aus Nullen und Einsen.
Um Goethes West-östlichen Divan, die Wettervorhersage oder einen Geburtstagsgruß in den Rechner zu bringen, hat sich ein schlauer Mensch ein praktisches System ausgedacht: Die Umwandlung von Buchstaben & Co. in Binärcode, d.h. die eben genannten Nullen und Einsen.
Der erste Standard-Code für Schriftzeichen, d.h. das erste anerkannte Regularium zur Kodierung von Zeichen in der Computerwelt, war der "American Standard Code for Information Interchange" oder auch ASCII oder US-ASCII. ASCII ist eine 7-Bit-Zeichenkodierung, eigentlich auf 8 Bit (einem Byte), aber da das erste Zeichen immer eine Null ist, bleiben nur sieben zur Darstellung der Zeichen übrig. So steht z. B. 01100001 für das 'a', 01000000 für das '@' und 00100000 für ein Leerzeichen.
Bei sieben Stellen mit 0 und/oder 1 kann man 2x2x2x2x2x2x2 also 128 Zeichen darstellen. Das hört sich erst einmal viel an. Da aber alle nützlichen wie kaum nützlichen Zeichen dargestellt werden müssen, erweisen sich 128 Möglichkeiten schnell als zu wenig - vor allem, wenn man auch anderen Sprachen als der englischen zugestehen will, in der Computertechnologie Verbreitung zu finden.
Es wurden also zahlreiche Standards gebildet, um so ziemlich jede Sprache dieser Welt darstellen zu können. Von Altenglisch bis Zulu sind heute ein Menge gesprochener und ungesprochener Sprachen standardisiert.
Nun könnte man fragen, warum man nicht einfach alle möglichen Zeichen dieser Welt in einem Standard zusammen fasst und diesen quasi als Supercode jedem Computer mitgibt. Mit UTF-32 gibt es auch einen ziemlich umfangreichen Zeichencode. Aus Speicherplatzgründen ist dieser aber äußerst unpraktisch: Umso mehr Bytes benötigt werden um ein Zeichen darzustellen (und genau das wäre in einem Supercode und ist in UTF-32 der Fall), desto mehr Speicher benötigen E-Mails, Dokumente & Co. Das ist bei ein paar Mails natürlich nicht so wild. Die Masse an weltweiten Daten wäre so aber schwierig zu bewältigen und würde enorme Kosten verursachen.
So gibt es sogar für den westeuropäischen Raum eine übersichtliche Zahl an "handlicheren" Zeichensätzen. Mail-Clients wie Thunderbird oder Outlook erkennen meist die Kodierung der empfangenen E-Mail und stellen sie richtig dar. Manchmal schlägt die Dekodierung aber fehl. Dann werden "nicht erkannte Zeichen" fälschlich dargestellt. Die Buchstaben des lateinischen Alphabetes machen dabei selten Probleme. Zu Fehldarstellungen kommt es bei den den Sprachen "eigenen" Zeichen wie den Umlauten im Deutschen oder den französischen Akzentzeichen (über Sprachen mit gänzlich anderem Schriftsystem reden wir erst gar nicht).
|
|

Diese UTF-8-kodierte E-Mail sieht für den Nutzer des Emacs-Mailreaders
etwas kryptisch aus
|

Dieselbe Mail in ISO-8859-1
|
Das alles ist auch nicht weiter schlimm und lässt sich leider auch nicht immer verhindern. Man sollte eben nur wissen, dass diese fremdartigen Zeichen in der E-Mail meist ganz einfach durch die vom Versender erwünschten "auszutauschen" sind - nämlich durch die korrekte Zeichenkodierung. Beim Thunderbird, Evolution oder Outlook lässt sich diese einfach ändern. Im Mozilla Thunderbird z. B. ändern Sie die Einstellungen unter "Ansicht - Zeichenkodierung".
Gleiches gilt übrigens auch für das Versenden von Mails. Auch hier können Sie die Kodierung mit den genannten Mail-Programmen festlegen. Gängigste Zeichenkodierungen im westeuropäischen Raum sind UTF-8 und ISO-8859-1 (Latin 1). Wenn Sie eine Mail erhalten, in der Zeichen eigenartig dargestellt werden, sollten Sie zu allererst diese beiden Kodierungen testen. Wie schon gesagt - den Kontext versteht man meist trotzdem. Sollten Sie die E-Mail jedoch weiter verwenden wollen, wäre eine korrekte Darstellung natürlich sehr hilfreich.
Im Deutschen können Sie diese Problematik übrigens recht einfach umgehen, und alle internationalen Kommunikationspartner sowie Nutzer von z. B. textbasierten Mail-Programmen, in denen man die Kodierung nicht so ohne weiteres angleichen kann, werden es Ihnen danken: Verwenden Sie einfach ue, oe, ae und ss anstelle der Umlaute und des ß.
|
|
|
|
|
|
|