Page 1 of 1

serendipity_event_aggregator - HTML-Entitäten nach Auslesen

Posted: Mon Nov 14, 2011 7:32 pm
by hagenroewer
Auslesen von RSS-Feeds und Ausgabe von HTML-Entitäten im Blog

Für einige lokale Webseiten von IG Metall Verwaltungstellen (örtliche Geschäftsstelle) lesen wir jeweils 2 RSS-Feeds aus:
1. Immer den RSS-Feeds des IG Metall Vorstands
und 2. den jeweiligen RSS-Feed der IG Metall Bezirksleitung, zu der die jeweilige Verwaltungsstelle dazugehört.

Dazu werden momentan folgende RSS-Feeds ausgelesen:
a. IG Metall Bayern für zwei S9Y-Projekt
b. IG Metall Baden-Württemberg für ein S9Y-Projekt
c. IG Metall NRW für ein S9Y-Projekt

a. und c. produzieren ihre Feeds via TYPO3; b. hingegen über eine ZOPE-Eigenentwicklung.

Im RSS Aggregator (serendipity_event_aggregator) werden die Feeds via Parser SimplePie ausgelesen, der die besten Ergebnisse liefert.

Weiterhin ist eingestellt:
Artikel entfernen = 30
Alte Artikel werden nach n Tagen aus der Datenbank entfernt (0 = Nie).

Die Option scheint aber nicht zu funktionieren, d.h. die Artikel verbleiben in der Datenbank.

Das größte Problem ist aber momentan das Auslesen des folgenden Zeichens

Code: Select all

"
(Anführungszeichen oben), das dann als folgende HTML-Entität

Code: Select all

"
ausgegeben wird.

Folgendes beobachtete ich auch für

Code: Select all

&
(Ampersand-Zeichen, kaufmännisches Und) als

Code: Select all

&
.

Beispiel 1:
Ausgabe nach Parsen:
http://igmrsg.de/aktuell/a/754-Oliver-B ... quot;.html

Original:
http://www.igmetall-nrw.net/Nachricht.2 ... ews%5D=938

RSS-Feed:
IG Metall NRW unter http://www.igmetall-nrw.net/index.php?type=100


Woran kann das liegen?
Wo muss ich noch rumschrauben?
:?: :?: :?

Gruß von der Ruhr

Re: serendipity_event_aggregator - HTML-Entitäten nach Ausle

Posted: Mon Nov 14, 2011 7:54 pm
by hagenroewer
Kurze Ergänzung:

Liegt das Problem mal wieder an den unterschiedlichen Zeichensätzen wie unter http://board.s9y.org/viewtopic.php?f=10&t=15039&p=85796 geschildert?

fragt

Re: serendipity_event_aggregator - HTML-Entitäten nach Ausle

Posted: Mon Nov 14, 2011 8:29 pm
by Timbalu
Hi

Ohne jetzt aktuell zu wissen woher das genau rührt, könnte man diesen Titel doch einfach mal hier

Code: Select all

html_entity_decode($title);
durchjagen, oder?

http://de.php.net/manual/de/function.ht ... decode.php

Das mit den Zeichensätzen müsstest du uns eigentlich beantworten.

Re: serendipity_event_aggregator - HTML-Entitäten nach Ausle

Posted: Tue Nov 15, 2011 9:32 pm
by hagenroewer
hagenroewer wrote: Das größte Problem ist aber momentan das Auslesen des folgenden Zeichens

Code: Select all

"
(Anführungszeichen oben), das dann als folgende HTML-Entität

Code: Select all

"
ausgegeben wird.

Folgendes beobachtete ich auch für

Code: Select all

&
(Ampersand-Zeichen, kaufmännisches Und) als

Code: Select all

&
.

Beispiel 1:
Ausgabe nach Parsen:
http://igmrsg.de/aktuell/a/754-Oliver-B ... quot;.html

Original:
http://www.igmetall-nrw.net/Nachricht.2 ... ews%5D=938

RSS-Feed:
IG Metall NRW unter http://www.igmetall-nrw.net/index.php?type=100
Hm, es sieht so aus, dass kaufmännische Und doppelt kodiert wird, d.h. für den Fall

Code: Select all

"
lese ich im Quelltext dann aber

Code: Select all

"
, was aber albern in dem Fall ist.

Könnte das Plugin
Übliche XHTML-Fehler beseitigen (serendipity_event_xhtmlcleanup)
helfen? Das ist nämlich im Projekt drin, und momentan sind alle Optionen auf Ja gesetzt.

Re: serendipity_event_aggregator - HTML-Entitäten nach Ausle

Posted: Tue Nov 15, 2011 9:34 pm
by hagenroewer
Timbalu wrote: Ohne jetzt aktuell zu wissen woher das genau rührt, könnte man diesen Titel doch einfach mal hier

Code: Select all

html_entity_decode($title);
durchjagen, oder?

http://de.php.net/manual/de/function.ht ... decode.php
Hm, PHP direkt in die Templates oder wo willst du das einbauen?

Re: serendipity_event_aggregator - HTML-Entitäten nach Ausle

Posted: Wed Nov 16, 2011 9:46 am
by garvinhicking
Hi!

Hrm, ich vermute mal dass der simplePie-Parser dafür mitverantwortlich sein könnte, der das Decoding hier etwas verändert.

Ist es Dir möglich mal die anderen Parser testweise auszuprobieren? Wenn es in einem davon klappt wüsste ich wo man ansetzen könnte.

Das html_entity_decode müsste man wenn eher im Aggregator-Plugin unterbauen, im Template macht's IMHO keinen Sinn.

Grüße,
Garvin

Re: serendipity_event_aggregator - HTML-Entitäten nach Ausle

Posted: Wed Nov 16, 2011 4:05 pm
by hagenroewer
garvinhicking wrote: Hrm, ich vermute mal dass der simplePie-Parser dafür mitverantwortlich sein könnte, der das Decoding hier etwas verändert.

Ist es Dir möglich mal die anderen Parser testweise auszuprobieren? Wenn es in einem davon klappt wüsste ich wo man ansetzen könnte.
Ich werde mal das in meinem Test-Projekt austesten, wobei bei mir in Erinnerung war, dass der simplePie-Parser die besten Ergebnisse liefert. So, nun das Test-Projekt updaten gehen, und später von den Ergebnissen berichten ...