Page 1 of 1
Crawling Fehler
Posted: Tue Apr 24, 2012 12:47 am
by milos27
Google Webmaster Tools zeigt mir mehr als 500 Crawling Fehler an. Schaut euch mal das Bild an. Die Seiten exisitieren nicht und mir ist schleierhaft wie das zustande kommt.
Beispiel:
http://www.trendlupe.de/archives/2009/05/C8.html

Re: Crawling Fehler
Posted: Tue Apr 24, 2012 8:39 am
by Timbalu
Auf alle Fälle ist das C zuviel ... denn das sind die Tages-Entry-Anzeigen.
Von der /archive Seite kommt das wahrscheinlich eher nicht, vermutlich eher von einem fehlerhaften Kalender Template Typo oder so. Aber du hast ja offensichtlich keinen... jetzt ...
Werden diese links denn immer noch gecrawlt oder sind da nur alte Einträge?
Re: Crawling Fehler
Posted: Tue Apr 24, 2012 9:19 am
by bernd_d
Klick den Link doch einfach mal an, dann geht ein Fenster auf in dem es das Register "Verlinkt über" gibt. Vielleicht findest du dann heraus, woher Google die URL kennt und kannst den Fehler dort beheben.
Re: Crawling Fehler
Posted: Tue Apr 24, 2012 11:35 am
by yellowled
Timbalu wrote:Auf alle Fälle ist das C zuviel ... denn das sind die Tages-Entry-Anzeigen.
Angesichts der Überschrift „Themen in Mai, 2009“ ist ziemlich klar abzuleiten, dass das vom Archiv erzeugte Monatsübersichten sind (entries_archives.tpl), die URL müsste allerdings jeweils "archive/YYYY/MM/summary.html" lauten.
Woher diese CX.html-URLs genau kommen, weiß ich allerdings auch nicht.
YL
Re: Crawling Fehler
Posted: Tue Apr 24, 2012 1:22 pm
by milos27
Die Links werden immer noch gecrawlt und es werden täglich mehr mittlerweile bei über 600 Crawling Fehlern. Soweit ich das erkennen kann sind diese Links auch in der Sitemap.
Update: Die Sitemap ist fehlerfrei dort sind die fehlerhaften Links nicht drin.
Wie bekomme ich das nun in den Griff?
So schauts aus wenn ich auf den Link klicke:
da sind Jahreseinträge die niemals gemacht worden sind

Re: Crawling Fehler
Posted: Tue Apr 24, 2012 3:42 pm
by yellowled
Hast oder hattest Du mal irgendwelche™ Plugins installiert, die das Archiv beeinflussen, etwa serendipity_event_customarchive?
YL
Re: Crawling Fehler
Posted: Tue Apr 24, 2012 3:45 pm
by milos27
ich hatte das free tag plugin eine ziemlich lange Zeit benutzt, dieses aber vor Monaten entfernt ...
Re: Crawling Fehler
Posted: Tue Apr 24, 2012 9:30 pm
by garvinhicking
HI!
Das "C" kommt von "Category". Das sind also die jeweiligen Kategorie-IDs der Permalinks.
Wenn Bots dem Kalender folgen und den vor/zurückblättern, dann kommen natürlich auch solche URLs zustande....wenn man das google sitemap plugin installiert dürften derartige URLs aber nicht in der sitemap auftauchen.
Grüße,
Garvin
Re: Crawling Fehler
Posted: Tue Apr 24, 2012 9:32 pm
by milos27
In der Sitemap sind diese nicht drin aber warum crawlt dann google diese nicht exisitierenden urls? Und ist das jetzt ein Problem?
Re: Crawling Fehler
Posted: Tue Apr 24, 2012 9:35 pm
by garvinhicking
milos27 wrote:In der Sitemap sind diese nicht drin aber warum crawlt dann google diese nicht exisitierenden urls? Und ist das jetzt ein Problem?
Wenn das nicht in der sitemap drin ist müsste man Google fragen woher das stammt; eventuell linken fremde Spam-Blogs auf derartige URLs.
IMHO ist das kein Problem.
Grüße,
Garvin
Re: Crawling Fehler
Posted: Thu Apr 26, 2012 10:10 pm
by milos27
Bekomme das Problem nicht im griff ... ahbe soeben von Google folgende Meldung erhalten:
Sehr geehrter Inhaber oder Webmaster von
http://www.trendlupe.de/, Beim Crawlen Ihrer Website haben wir einen Anstieg in der Anzahl der Soft 404-Fehler um etwa 2012-04-25 00:00 UTC (London, Dublin, Edinburgh) bemerkt. Auf Ihrer Website ist es möglicherweise zu Ausfällen gekommen. Es ist möglich, dass das Problem bereits behoben ist. Nachfolgend finden Sie einige Beispielseiten, die Soft 404-Fehler hervorgerufen haben:
•
http://www.trendlupe.de/archives/1979/08/C9.html
•
http://www.trendlupe.de/archives/1979/06/C13.html
•
http://www.trendlupe.de/archives/2004/11/C9.html
Weitere Informationen finden Sie in der Webmaster-Tools-Hilfe: Soft 404-Fehler
Ich glaube kaum das andere Seiten auf fehlerhafte Links linken, es muss doch möglich sein dieses problem beseitigen ...
Re: Crawling Fehler
Posted: Fri Apr 27, 2012 9:47 am
by garvinhicking
Hi!
Na dann frag doch direkt mal woher das kommt, sag dass du einen Sitemap hast in der die URLs nicht stehen, und woher der Crawler denn auf diese URLs kommt, was also der URL-Referrer ist.
Auf deiner Seite ist ja garkein Kalender eingebunden, oder? Insofern wüsste ich eh garnicht wie man manuell auf einen Link mit Archivdatum bei Dir kommen sollte...
Grüße,
Garvin
Re: Crawling Fehler
Posted: Fri Apr 27, 2012 10:43 am
by Timbalu
Wahrscheinlich müsste man eine neue rewrite rule entwerfen, welche die URL
http://www.trendlupe.de/archives/1970/01/C1.html (200 OK, aber ungültig, da nicht vorhanden)
in
http://www.trendlupe.de/archives/C1.html (200 OK, gültig, da Kurzform von /categories/1-xxx)
umschreibt.
etwa so (ungetestet...)
RewriteRule ^archives/(/\d{4}/)/(/\d{2}/)/C(/\d{1,2}/).html index.php?url=/archives/C$3.html [NC,L,QSA]