Crawling Fehler

milos27 · Post by **milos27** » Tue Apr 24, 2012 12:47 am

Google Webmaster Tools zeigt mir mehr als 500 Crawling Fehler an. Schaut euch mal das Bild an. Die Seiten exisitieren nicht und mir ist schleierhaft wie das zustande kommt.

Beispiel:

http://www.trendlupe.de/archives/2009/05/C8.html

Timbalu · Post by **Timbalu** » Tue Apr 24, 2012 8:39 am

Auf alle Fälle ist das C zuviel ... denn das sind die Tages-Entry-Anzeigen.
Von der /archive Seite kommt das wahrscheinlich eher nicht, vermutlich eher von einem fehlerhaften Kalender Template Typo oder so. Aber du hast ja offensichtlich keinen... jetzt ...
Werden diese links denn immer noch gecrawlt oder sind da nur alte Einträge?

Post by **bernd_d** » Tue Apr 24, 2012 9:19 am

Klick den Link doch einfach mal an, dann geht ein Fenster auf in dem es das Register "Verlinkt über" gibt. Vielleicht findest du dann heraus, woher Google die URL kennt und kannst den Fehler dort beheben.

Post by **yellowled** » Tue Apr 24, 2012 11:35 am

Timbalu wrote:Auf alle Fälle ist das C zuviel ... denn das sind die Tages-Entry-Anzeigen.

Angesichts der Überschrift „Themen in Mai, 2009“ ist ziemlich klar abzuleiten, dass das vom Archiv erzeugte Monatsübersichten sind (entries_archives.tpl), die URL müsste allerdings jeweils "archive/YYYY/MM/summary.html" lauten.

Woher diese CX.html-URLs genau kommen, weiß ich allerdings auch nicht.

YL

milos27 · Post by **milos27** » Tue Apr 24, 2012 1:22 pm

Die Links werden immer noch gecrawlt und es werden täglich mehr mittlerweile bei über 600 Crawling Fehlern. Soweit ich das erkennen kann sind diese Links auch in der Sitemap.

Update: Die Sitemap ist fehlerfrei dort sind die fehlerhaften Links nicht drin.

Wie bekomme ich das nun in den Griff?

So schauts aus wenn ich auf den Link klicke:

da sind Jahreseinträge die niemals gemacht worden sind

Post by **yellowled** » Tue Apr 24, 2012 3:42 pm

Hast oder hattest Du mal irgendwelche™ Plugins installiert, die das Archiv beeinflussen, etwa serendipity_event_customarchive?

YL

milos27 · Post by **milos27** » Tue Apr 24, 2012 3:45 pm

ich hatte das free tag plugin eine ziemlich lange Zeit benutzt, dieses aber vor Monaten entfernt ...

Post by **garvinhicking** » Tue Apr 24, 2012 9:30 pm

HI!

Das "C" kommt von "Category". Das sind also die jeweiligen Kategorie-IDs der Permalinks.

Wenn Bots dem Kalender folgen und den vor/zurückblättern, dann kommen natürlich auch solche URLs zustande....wenn man das google sitemap plugin installiert dürften derartige URLs aber nicht in der sitemap auftauchen.

Grüße,
Garvin

milos27 · Post by **milos27** » Tue Apr 24, 2012 9:32 pm

In der Sitemap sind diese nicht drin aber warum crawlt dann google diese nicht exisitierenden urls? Und ist das jetzt ein Problem?

Post by **garvinhicking** » Tue Apr 24, 2012 9:35 pm

milos27 wrote:In der Sitemap sind diese nicht drin aber warum crawlt dann google diese nicht exisitierenden urls? Und ist das jetzt ein Problem?

Wenn das nicht in der sitemap drin ist müsste man Google fragen woher das stammt; eventuell linken fremde Spam-Blogs auf derartige URLs.

IMHO ist das kein Problem.

Grüße,
Garvin

milos27 · Post by **milos27** » Thu Apr 26, 2012 10:10 pm

Bekomme das Problem nicht im griff ... ahbe soeben von Google folgende Meldung erhalten:

Sehr geehrter Inhaber oder Webmaster von http://www.trendlupe.de/, Beim Crawlen Ihrer Website haben wir einen Anstieg in der Anzahl der Soft 404-Fehler um etwa 2012-04-25 00:00 UTC (London, Dublin, Edinburgh) bemerkt. Auf Ihrer Website ist es möglicherweise zu Ausfällen gekommen. Es ist möglich, dass das Problem bereits behoben ist. Nachfolgend finden Sie einige Beispielseiten, die Soft 404-Fehler hervorgerufen haben:
• http://www.trendlupe.de/archives/1979/08/C9.html
• http://www.trendlupe.de/archives/1979/06/C13.html
• http://www.trendlupe.de/archives/2004/11/C9.html
Weitere Informationen finden Sie in der Webmaster-Tools-Hilfe: Soft 404-Fehler

Ich glaube kaum das andere Seiten auf fehlerhafte Links linken, es muss doch möglich sein dieses problem beseitigen ...

Post by **garvinhicking** » Fri Apr 27, 2012 9:47 am

Hi!

Na dann frag doch direkt mal woher das kommt, sag dass du einen Sitemap hast in der die URLs nicht stehen, und woher der Crawler denn auf diese URLs kommt, was also der URL-Referrer ist.

Auf deiner Seite ist ja garkein Kalender eingebunden, oder? Insofern wüsste ich eh garnicht wie man manuell auf einen Link mit Archivdatum bei Dir kommen sollte...

Grüße,
Garvin

Timbalu · Post by **Timbalu** » Fri Apr 27, 2012 10:43 am

Wahrscheinlich müsste man eine neue rewrite rule entwerfen, welche die URL
http://www.trendlupe.de/archives/1970/01/C1.html (200 OK, aber ungültig, da nicht vorhanden)
in
http://www.trendlupe.de/archives/C1.html (200 OK, gültig, da Kurzform von /categories/1-xxx)
umschreibt.
etwa so (ungetestet...)
RewriteRule ^archives/(/\d{4}/)/(/\d{2}/)/C(/\d{1,2}/).html index.php?url=/archives/C$3.html [NC,L,QSA]

Crawling Fehler

Crawling Fehler

Re: Crawling Fehler

Re: Crawling Fehler

Re: Crawling Fehler

Re: Crawling Fehler

Re: Crawling Fehler

Re: Crawling Fehler

Re: Crawling Fehler

Re: Crawling Fehler

Re: Crawling Fehler

Re: Crawling Fehler

Re: Crawling Fehler

Re: Crawling Fehler