Page 1 of 2
Umlauteproblem nach 1:1 Umzug
Posted: Thu Nov 23, 2006 3:07 pm
by Harald Weingaertner
Hallo,
ich habe sämtliche existierende Threads dazu nun durch und doch ist mein Problem etwas anders...
Mein Hoster hat meine ganzen Daten von einem auf einen anderen Server umgezogen. Das hat auch ganz gut geklappt. Nur sehe ich in einigen Blogs jetzt diese komischen Sonderzeichen, wo vorher äüöß waren. Daraufhin hatte der Hoster noch etwas verändert und ich sah wieder üöäß.
Nun habe ich leider nach einer Woche festgestellt, dass es weitere Probleme mit den Sonderzeichen gibt.
Unter
http://blog.webgurus.de/archiv/169-Neuer-Supermod.html gibt es einen Artikel im s9y, der voll von Sonderzeichen ist. Dieser Artikel wird per RSS von einem Forum abgeholt und erscheint im Forum dann plötzlich ohne Sonderzeichen (
http://www.webgurus.de/forum/showthread ... post251249). Vor dem Umzug ging das alles.
Nun habe ich dieses Problem leider erst nach einer Woche bemerkt und kann das Backup von vor einer Woche nicht mehr einspielen.
Gibt es irgendeine Möglichkeit alles wieder so zu machen, dass ich meine Sonderzeichen in den Blogs und auch in den zur Verfügung gestellten Feeds wiederbekomme?
Harald
Re: Umlauteproblem nach 1:1 Umzug
Posted: Thu Nov 23, 2006 3:44 pm
by garvinhicking
Hi!
Das Tool/Plugin was deine Einträge im Forum postet scheint die UTF-8 Datenbank nicht korrekt anzusprechen.
Es ist kein Serendipity-Problem, daher musst du im Tools des Forums ansetzen. Vermutlich sendet dieses Tool keine "SET NAMES utf8" oder ähnliche SQL-Abfragen...
Viele Grüße,
Garvin
Re: Umlauteproblem nach 1:1 Umzug
Posted: Thu Nov 23, 2006 3:55 pm
by Harald Weingaertner
garvinhicking wrote:Hi!
Das Tool/Plugin was deine Einträge im Forum postet scheint die UTF-8 Datenbank nicht korrekt anzusprechen.
Es ist kein Serendipity-Problem, daher musst du im Tools des Forums ansetzen. Vermutlich sendet dieses Tool keine "SET NAMES utf8" oder ähnliche SQL-Abfragen...
Aber vor dem Umzug ging das noch. Sämtliche andere RSS Feeds haben auch korrekte Umlaute. Nur der RSS Feed aus diesem einen s9y Blog kommt mit kaputten Umlauten an... Was besonders deshalb so komisch ist, weil die ja im Beitrag korrekt angezeigt werden.
Und vor dem Serverumzug waren alle ä im Blog auch ä im Forum... ?
Re: Umlauteproblem nach 1:1 Umzug
Posted: Thu Nov 23, 2006 3:58 pm
by garvinhicking
Hi!
Ein Umzug von MySQL 4.0 zu 4.1 bringt solche Probleme mit sich.
So ein Umzug kann schwerwiegende Folgen haben, wie Du ja gerade merkst.
Aber vor dem Umzug ging das noch. Sämtliche andere RSS Feeds haben auch korrekte Umlaute. Nur der RSS Feed aus diesem einen s9y Blog kommt mit kaputten Umlauten an... Was besonders deshalb so komisch ist, weil die ja im Beitrag korrekt angezeigt werden.
Welche anderen Feeds z.B. nutzt Du denn sonst noch?
Bist Du Dir 100%ig sicher dass Du dein blogfeed sonst genauso importierst wie die anderen funktionierenden Feeds? Nicht dass du die einen lokal ziehst und die naderen per HTTP oder so...
Grüße,
Garvin
Posted: Thu Nov 23, 2006 4:40 pm
by Harald Weingaertner
Hi Garvin,
bei mir war der Umzug mit der Änderung von SQL4 nach SQL5 verbunden.
Sonstige Feeds sind zB:
http://blog.webgurus.de/feeds/index.rss1 (der kaputte)
http://rss.golem.de/rss.php?feed=RSS1.0
http://www.handelsblatt.com/rss/hb.xml
Die Feeds werden alle von dem vBulletin selbst (das Forum) importiert. Ich bin deshalb so sicher, weil es vor dem Umzug alles wunderbar funktionierte und ich an den Feeds selber nichts geändert habe.
Zuerst hatte ich auch im Blog überall diese fehlerhaften Umlaute. Das hatte ich dem Hoster dann gesagt. Der hatte gesagt, dass die Datenbanken aber 1:1 kopiert wurden und trotzdem etwas geändert, so dass in den Beiträgen der Blogs dann die Umlaute wieder korrekt angezeigt werden. Das mit den Feeds ist mir erst jetzt aufgefallen.
Allerdnigs verwundert mich, dass die Umlaute völlig korrekt angezeigt werden, wenn man
http://blog.webgurus.de/feeds/index.rss1 manuell im Browser aufruft... Da würde ich ja dann doch eher vermuten, dass es etwas mit dem vBulletin zu tun hat. Komisch...
Posted: Thu Nov 23, 2006 5:17 pm
by garvinhicking
Hi!
Diese 2 Feeds sind im ISO-8859-1 Format! Daher tritt das Problem nicht auf. Dein Blog Feed ist im UTF-8 Format (das ist soweit korrekt). Anscheinend kommt dein Importer beim Rekodieren nicht klar.
Früher war dein Blog evtl. auch ISO, oder SQL hat sich halt nicht so sehr drum gekümmert, dass es egal war ob dein UTF-8 als ISO oder als UTF abgespeichert wurde.
Kurzfassung: Der Serverumzug ist der Auslöser, die Ursache ist ein nicht absolut korrekt funktionierendes/kompatibles Import-Script.
Viele Grüße,
Garvin
Posted: Thu Nov 23, 2006 5:28 pm
by Harald Weingaertner
Du hast den Teil mit der Lösung vergessen
Gibt es da evtl. eine Chance das wieder in den Griff zu bekommen? Ich würde sogar das Blog nochmal neu installieren, wenn das etwas hilft. Ich würde nur gerne die alten Einträge wieder herstellen können.
Eine Neuinstallation des Blogs würde wohl nicht viel bringen. Soll/kann ich das Blog dann von UTF-8 auf ISO-8859-1 umstellen?
Gruß, Harald
Posted: Thu Nov 23, 2006 5:56 pm
by garvinhicking
Hi!
Die Lösung liegt bei vBulletin, da muss ich dich leider zu deren Foren lotsen.
Gibt es da evtl. eine Chance das wieder in den Griff zu bekommen? Ich würde sogar das Blog nochmal neu installieren, wenn das etwas hilft. Ich würde nur gerne die alten Einträge wieder herstellen können.
Tja, Du könntest Dein Blog wieder zurück auf ISO-8859-1 umstellen. Da bist Du (oder derjenige der dir die anleitung schreibt) längere Zeit mit beschäftigt. Und es wäre nur symptomatisch.
Sinnvoller ist es, dass der vbulletin importer charsets vernünftig handled.
Probiere mal einen x-beliebigen, serendipity-unabhängigen RSS-Feed zu importeren der als UTF-8 Charset exportiert wird. Dort solltest Du das selbe Problem haben.
Viele Grßüe,
Garvin
Posted: Thu Nov 23, 2006 6:28 pm
by Harald Weingaertner
garvinhicking wrote:
Probiere mal einen x-beliebigen, serendipity-unabhängigen RSS-Feed zu importeren der als UTF-8 Charset exportiert wird. Dort solltest Du das selbe Problem haben.
Naja, der genannte Thread war ja bis letzte Woche auch ein UTF-8 Thread. Einziger Unterschied: Vorher war das alles in einer SQL4 Datenbank und jetzt ist es in einer SQL5 Datenbank.
Also verstehe ich es so, dass UTF-8 in einer SQL4 Datenbank klappt und UTF-8 in einer SQL5 Datenbank nicht klappt. Aber das kann ich als Laie mir gar nicht vorstellen - aber kann das tatsächlich mit der Version der Datenbank zusammenhängen?
Dieser Beitrag:
http://www.webgurus.de/forum/showpost.p ... ostcount=1
wird völlig korrekt dargestellt und ist ebenfalls aus dem gleichen Blog gesaugt worden. Mit dem gleichen Forum, nur war damals alles noch in einer SQL4 Datenbank gespeichert. Mehr Unterschiede gibt es eigentlich nicht

Posted: Thu Nov 23, 2006 6:44 pm
by garvinhicking
Hi!
Naja, der genannte Thread war ja bis letzte Woche auch ein UTF-8 Thread. Einziger Unterschied: Vorher war das alles in einer SQL4 Datenbank und jetzt ist es in einer SQL5 Datenbank.
Du meinst Feed, nicht Thread?
Wie gesagt, es ist ein Unterschied ob Deine Datenbank jetzt SQL4 oder SQL5 ist. Früher konnte man mit PHP einfach ISO in UTF8 Tabellen speichern. Das geht seit MySQL 5 nicht mehr, da muss UTF-8 auch wirklich UTf-8 sein.
Vertrau mir bitte. Es liegt am Importer.
Also verstehe ich es so, dass UTF-8 in einer SQL4 Datenbank klappt und UTF-8 in einer SQL5 Datenbank nicht klappt. Aber das kann ich als Laie mir gar nicht vorstellen - aber kann das tatsächlich mit der Version der Datenbank zusammenhängen?
Nein, UTF-8 funktioniert in beiden Versionen. Aber In MySQL >= 4.1 muss man eine UTf-8 Verbindung explizit als UTf-8 kennzeichen, früher musste man das nicht.
Viele Grüße,
Garvin
Posted: Thu Nov 23, 2006 6:55 pm
by Harald Weingaertner
[quote="garvinhicking"]
Vertrau mir bitte. Es liegt am Importer.
[quote]
Gut, ich vertraue dir und melde das an vBulletin weiter.

Danke für deine Hilfe.
Posted: Thu Nov 23, 2006 7:04 pm
by garvinhicking
Hi!
Vermutlich werden die vbulletin-Leute alles mögliche von deinem Server wissen wollen. PHP-Version, MySQL Client API-Version, iconv/recode Installation für PHP, Connection und Client Charset von MySQL, Server-Charset von MySQL, Server Collations deiner Tabellen, etc.
Ich kann Dir jetzt schon sagen dass das spaßig werden wird, wenn Du bereits die aktuellste vbulleting Version einsetzt - dann sind nämlich die Chancen groß, dass sich bisher dem MySQL-Charset Problem noch keiner angenommen hat. Wurde bei s9y ja auch erst vor ca. 9 Monaten gemacht.
Viele Grüße,
Garvin
Posted: Thu Nov 23, 2006 7:39 pm
by Harald Weingaertner
Oh Gott
Vielleicht sollte ich einfach keine UTF-8 Feeds mehr importieren

Ich verstehe auch gar nicht wieso ich s9y damals gesagt habe, dass es UTF-8 nehmen soll. Wieso kann ich nicht einfach dieses ISO einstellen

Posted: Thu Nov 23, 2006 10:45 pm
by garvinhicking
Hi!
UTF-8 ist viel besser. Das ist die Zukunft. ISO ist veraltet und wird in Zukunft mehr PRobleme verursachen.
Das Problem ist schlicht dass erst seit einigen Jahren die Entwickler auf den UTF-8 Zug aufspringen und es Inkompatibilitäten beim Umstieg gibt...
Sprich: Du willst das nicht auf ISO umstellen, sondern Du willst lieber die vbulletin-Menschen davon überzeugen, dass vollständigerUTF-8 SUpport dringend notwendig ist.
Viele Grüße,
Garvin
Posted: Thu Nov 23, 2006 11:05 pm
by Harald Weingaertner
Gut, das erste Feedback lautet: "Do you have iconv compiled into PHP?"
Sie haben es also schonmal gelesen und ich stehe dann jetzt auch auf UTF-8...