Page 1 of 1

Problem mit UTF-8 in rss-feeds

Posted: Fri Jul 28, 2006 5:28 pm
by stm999999999
Hallo,
ich bin nun am rumprobieren mit Feedburner und da fiel mir auf, daß über feedburner alle Umlaute kaputt sind:

http://www.feedvalidator.org/check.cgi? ... zgeflyster

Dasselbe mit dem Feed probiert, der Feedburner beliefert, ebenfalls mit Fehlern:

http://www.feedvalidator.org/check.cgi? ... index.rss2

Nur der Kategegorie-Feed, der validiert:
http://www.feedvalidator.org/check.cgi? ... est3-1.rss

:-(

Re: Problem mit UTF-8 in rss-feeds

Posted: Fri Jul 28, 2006 6:36 pm
by garvinhicking
Hi!

Der Feedvalidator zeigt dir auch nur den feedburner feed, weil du auf "force fb" gestellt hast. Bitte deaktivier das mal nächste Woche Montag damit ich mir den richtigen Feed ansehen kann (habe jetzt kein plugin um meinen User Agent zu faken).

Ich schätze dass Du dein UTF-8 Charset evtl. nicht richtig eingestellt hast? Prinzipiell klappen UTF-8 feeds von s9y...

Viele Grüße,
GArvin

Posted: Fri Jul 28, 2006 6:42 pm
by stm999999999
a) ja, sorry, hatte ich testweise wieder an. Als ich das Posting oben schrieb und die Feeds untgersucht hatte, da war es aus. Nun ist es auch wieder aus.

b) Eigentlich sollte hier alles iO sein, ich habe jedenfalls in der Konfiguration von s9y UTF-8 eingestellt und alle Artikel erscheinen auf der Webseite ja auch sauber und im Header ist es auch so deklariert "charset=UTF-8"

Posted: Fri Jul 28, 2006 6:45 pm
by garvinhicking
Hi!

Okay, danke! Habe mir den Feed angesehen - Du hast anscheinend ein falsches "ß" in deinem Feed an einer Stelle. Evtl. per Copy und paste dort falsch reingeraten, jedenfalls ist das nicht im UTF-8 ZEichensatz! Wie ist der Buchstabe dort hingelangt? Einfach mal den Eintrag editieren und ersetzen, dann müsste es klappen.

Feedburner hat sich vermutlich an diesem Zeichen verschluckt und dann alles als ISO reingekippt.

Grüße,
Garvin

Posted: Fri Jul 28, 2006 6:58 pm
by stm999999999
Äh, ein WAS?

Was ist denn ein falsches ß und woran erkenne ich das? Oder kannst Du mir die Eintrags-ID nennen?

[EDIT] Aah, ich nehme mal an, Du meinst in http://blog.stephan.manske-net.de/archi ... -kann.html

Keine Ahnung, wie die da reingekommen sind. Ja, das ganze kam per c&p aus Word IIRC, aber bislang was das eigentlich immer OK gewesen in diesem Artikel, ich kann mich jedenfalls nicht an die nun sichtbaren Sonderzeichen |? etc. erinnern.

Mal gucken, was Feedburner nun macht.

Posted: Fri Jul 28, 2006 7:01 pm
by garvinhicking
Hi!

Schau Dir einfach die Ausgabe vom Feedvalidator an, da siehst du denn den kontext des falschen ß.

UTF-8 benutzt 2-byte zeichen für Sonderzeichen, ISO nur 1-byte. Wenn also ein ß mit 1-byte gespeichert wurde (durch copy+paste oder evtl. auch phpmyadmin bearbeitung) dann ist das kein gültiges UTF-8 ZEichen...

Da das nur bei einem einzelnen zeichen angemäkelt wird schätze ich, dass da etwas speziell schiefgelaufen ist und kein generelles problem ist.

Grüße,
garvin

Posted: Fri Jul 28, 2006 7:09 pm
by stm999999999
Es war bei weitem nicht nur ein ß es waren etliche und auch noch ein vermurkstes €...

Aber ich nehme mal an, die Validatoren brechen dann beim ersten Auftreten ab.

Jedenfalls danke, jetzt geht es sauber! :-)