Google Webmaster Tools zeigt mir mehr als 500 Crawling Fehler an. Schaut euch mal das Bild an. Die Seiten exisitieren nicht und mir ist schleierhaft wie das zustande kommt.
Auf alle Fälle ist das C zuviel ... denn das sind die Tages-Entry-Anzeigen.
Von der /archive Seite kommt das wahrscheinlich eher nicht, vermutlich eher von einem fehlerhaften Kalender Template Typo oder so. Aber du hast ja offensichtlich keinen... jetzt ...
Werden diese links denn immer noch gecrawlt oder sind da nur alte Einträge?
Klick den Link doch einfach mal an, dann geht ein Fenster auf in dem es das Register "Verlinkt über" gibt. Vielleicht findest du dann heraus, woher Google die URL kennt und kannst den Fehler dort beheben.
Timbalu wrote:Auf alle Fälle ist das C zuviel ... denn das sind die Tages-Entry-Anzeigen.
Angesichts der Überschrift „Themen in Mai, 2009“ ist ziemlich klar abzuleiten, dass das vom Archiv erzeugte Monatsübersichten sind (entries_archives.tpl), die URL müsste allerdings jeweils "archive/YYYY/MM/summary.html" lauten.
Woher diese CX.html-URLs genau kommen, weiß ich allerdings auch nicht.
Die Links werden immer noch gecrawlt und es werden täglich mehr mittlerweile bei über 600 Crawling Fehlern. Soweit ich das erkennen kann sind diese Links auch in der Sitemap.
Update: Die Sitemap ist fehlerfrei dort sind die fehlerhaften Links nicht drin.
Wie bekomme ich das nun in den Griff?
So schauts aus wenn ich auf den Link klicke:
da sind Jahreseinträge die niemals gemacht worden sind
Das "C" kommt von "Category". Das sind also die jeweiligen Kategorie-IDs der Permalinks.
Wenn Bots dem Kalender folgen und den vor/zurückblättern, dann kommen natürlich auch solche URLs zustande....wenn man das google sitemap plugin installiert dürften derartige URLs aber nicht in der sitemap auftauchen.
Grüße,
Garvin
# Garvin Hicking (s9y Developer)
# Did I help you? Consider making me happy: http://wishes.garv.in/
# or use my PayPal account "paypal {at} supergarv (dot) de"
# My "other" hobby: http://flickr.garv.in/
milos27 wrote:In der Sitemap sind diese nicht drin aber warum crawlt dann google diese nicht exisitierenden urls? Und ist das jetzt ein Problem?
Wenn das nicht in der sitemap drin ist müsste man Google fragen woher das stammt; eventuell linken fremde Spam-Blogs auf derartige URLs.
IMHO ist das kein Problem.
Grüße,
Garvin
# Garvin Hicking (s9y Developer)
# Did I help you? Consider making me happy: http://wishes.garv.in/
# or use my PayPal account "paypal {at} supergarv (dot) de"
# My "other" hobby: http://flickr.garv.in/
Na dann frag doch direkt mal woher das kommt, sag dass du einen Sitemap hast in der die URLs nicht stehen, und woher der Crawler denn auf diese URLs kommt, was also der URL-Referrer ist.
Auf deiner Seite ist ja garkein Kalender eingebunden, oder? Insofern wüsste ich eh garnicht wie man manuell auf einen Link mit Archivdatum bei Dir kommen sollte...
Grüße,
Garvin
# Garvin Hicking (s9y Developer)
# Did I help you? Consider making me happy: http://wishes.garv.in/
# or use my PayPal account "paypal {at} supergarv (dot) de"
# My "other" hobby: http://flickr.garv.in/
Wahrscheinlich müsste man eine neue rewrite rule entwerfen, welche die URL http://www.trendlupe.de/archives/1970/01/C1.html (200 OK, aber ungültig, da nicht vorhanden)
in http://www.trendlupe.de/archives/C1.html (200 OK, gültig, da Kurzform von /categories/1-xxx)
umschreibt.
etwa so (ungetestet...)
RewriteRule ^archives/(/\d{4}/)/(/\d{2}/)/C(/\d{1,2}/).html index.php?url=/archives/C$3.html [NC,L,QSA]