Tag Archives: kodierung

Schei? Encoding! ISO 8859 vs. UTF-8

GetDigital.de: Schei? Encoding

"Schei? Encoding" Shirt von GetDigital.de

Der alte Kampf bei der Zeichenkodierung ist immer noch nicht ausgefochten: ISO 8859 oder UTF-8…? WTF-8 UTF-8 ist bzgl. des Zeichenvorrats weit umfassender, da hier etwa auch die deutschen Umlaute enthalten sind und diese somit nicht mehr – wie bei ISO 8859 – mit HTML-Entitäten wie

ü

für

ü

kodiert werden müssen. Doch auch wenn das Internet Mail Consortium (IMC) seit 1998 für E-Mail-Clients die Unterstützung von UTF-8 empfiehlt: bis heute gibt es mitunter noch Darstellunsprobleme. Bei Web.de werden einige UTF-8 kodierte Sonderzeichen (z. B. das Euro-Währungssymbol) beispielsweise durch einen hässlichen Platzhalter ersetzt. Bei Gmx und AOL zeigen sich die selben Probleme, wenn der UTF-8-kodierte E-Mail-Quelltext versehentlich als ISO 8859-1 kodierte E-Mail versendet wurde – hier fällt das Euro-Symbol im Betreff einfach weg.

Fazit: Auch wenn sich meiner Erfahrung nach die kodierungsbedingten Darstellungsprobleme auf einige wenige Sonderzeichen (z. B. “€”) und in der Regel auf die Betreffzeile reduzieren: es empfiehlt sich, ISO 8859-1-kodierte E-Mails zu versenden, da dies der probate kleinste gemeinsame Nenner ist.[1]

Ergänzung:

Christoph Bajohr hat in seinem WalkingSmall-Blog die UTF-8-Unterstützung der gängigen E-Mail-Clients und Webmailer noch einmal tabellarisch zusammengefasst.

Alle leidgeplagten Marketer können übrigens ihren Unmut schweigend mit dem nebenstehenden Stoff-Fetzen kundtun… ;-)

http://www.getdigital.de/products/scheiss_encoding

Noch mehr lustige Geek-Wear von GetDigital.de gibt’s hier.

(Via 100partnerprogramme.de)

Fußnote

[1] Beim vorangegangenen Posting “Conrad: Optimiertes Mailing sowie interessanter E-Mail-Absender” hat sich übrigens auch ein Kodierungsfehler – im E-Mail-Body in einer ISO-kodierten E-Mail – eingeschlichen. Wer ihn als erster findet, bekommt auf der Dmexco ne saftige Pilsette von mir aufe Hand. ;-) Tipp: Man schaue in die alt-Texte und sei sich der Tatsache bewusst, dass die E-Mail zwar ISO 8895-1-kodiert ist, aber ein ü dort als C3BC (= ü in UTF-8) kodiert wurde, was in zwei “wirren” Zeichen resultiert – 1x C3 in ISO und 1x BC in ISO.