Crawling Fehler

Hier können Probleme und alles andere in Deutscher Sprache gelöst werden.
Post Reply
milos27
Regular
Posts: 154
Joined: Sun Jul 06, 2008 8:31 pm
Contact:

Crawling Fehler

Post by milos27 »

Google Webmaster Tools zeigt mir mehr als 500 Crawling Fehler an. Schaut euch mal das Bild an. Die Seiten exisitieren nicht und mir ist schleierhaft wie das zustande kommt.

Beispiel:

http://www.trendlupe.de/archives/2009/05/C8.html

Image
Timbalu
Regular
Posts: 4598
Joined: Sun May 02, 2004 3:04 pm

Re: Crawling Fehler

Post by Timbalu »

Auf alle Fälle ist das C zuviel ... denn das sind die Tages-Entry-Anzeigen.
Von der /archive Seite kommt das wahrscheinlich eher nicht, vermutlich eher von einem fehlerhaften Kalender Template Typo oder so. Aber du hast ja offensichtlich keinen... jetzt ...
Werden diese links denn immer noch gecrawlt oder sind da nur alte Einträge?
Regards,
Ian

Serendipity Styx Edition and additional_plugins @ https://ophian.github.io/ @ https://github.com/ophian
bernd_d
Regular
Posts: 468
Joined: Thu Jun 03, 2010 9:28 am
Contact:

Re: Crawling Fehler

Post by bernd_d »

Klick den Link doch einfach mal an, dann geht ein Fenster auf in dem es das Register "Verlinkt über" gibt. Vielleicht findest du dann heraus, woher Google die URL kennt und kannst den Fehler dort beheben.
yellowled
Regular
Posts: 7111
Joined: Fri Jan 13, 2006 11:46 am
Location: Eutin, Germany
Contact:

Re: Crawling Fehler

Post by yellowled »

Timbalu wrote:Auf alle Fälle ist das C zuviel ... denn das sind die Tages-Entry-Anzeigen.
Angesichts der Überschrift „Themen in Mai, 2009“ ist ziemlich klar abzuleiten, dass das vom Archiv erzeugte Monatsübersichten sind (entries_archives.tpl), die URL müsste allerdings jeweils "archive/YYYY/MM/summary.html" lauten.

Woher diese CX.html-URLs genau kommen, weiß ich allerdings auch nicht.

YL
milos27
Regular
Posts: 154
Joined: Sun Jul 06, 2008 8:31 pm
Contact:

Re: Crawling Fehler

Post by milos27 »

Die Links werden immer noch gecrawlt und es werden täglich mehr mittlerweile bei über 600 Crawling Fehlern. Soweit ich das erkennen kann sind diese Links auch in der Sitemap.

Update: Die Sitemap ist fehlerfrei dort sind die fehlerhaften Links nicht drin.

Wie bekomme ich das nun in den Griff?

So schauts aus wenn ich auf den Link klicke:

Image

da sind Jahreseinträge die niemals gemacht worden sind :-(

Image
yellowled
Regular
Posts: 7111
Joined: Fri Jan 13, 2006 11:46 am
Location: Eutin, Germany
Contact:

Re: Crawling Fehler

Post by yellowled »

Hast oder hattest Du mal irgendwelche™ Plugins installiert, die das Archiv beeinflussen, etwa serendipity_event_customarchive?

YL
milos27
Regular
Posts: 154
Joined: Sun Jul 06, 2008 8:31 pm
Contact:

Re: Crawling Fehler

Post by milos27 »

ich hatte das free tag plugin eine ziemlich lange Zeit benutzt, dieses aber vor Monaten entfernt ...
garvinhicking
Core Developer
Posts: 30022
Joined: Tue Sep 16, 2003 9:45 pm
Location: Cologne, Germany
Contact:

Re: Crawling Fehler

Post by garvinhicking »

HI!

Das "C" kommt von "Category". Das sind also die jeweiligen Kategorie-IDs der Permalinks.

Wenn Bots dem Kalender folgen und den vor/zurückblättern, dann kommen natürlich auch solche URLs zustande....wenn man das google sitemap plugin installiert dürften derartige URLs aber nicht in der sitemap auftauchen.

Grüße,
Garvin
# Garvin Hicking (s9y Developer)
# Did I help you? Consider making me happy: http://wishes.garv.in/
# or use my PayPal account "paypal {at} supergarv (dot) de"
# My "other" hobby: http://flickr.garv.in/
milos27
Regular
Posts: 154
Joined: Sun Jul 06, 2008 8:31 pm
Contact:

Re: Crawling Fehler

Post by milos27 »

In der Sitemap sind diese nicht drin aber warum crawlt dann google diese nicht exisitierenden urls? Und ist das jetzt ein Problem?
garvinhicking
Core Developer
Posts: 30022
Joined: Tue Sep 16, 2003 9:45 pm
Location: Cologne, Germany
Contact:

Re: Crawling Fehler

Post by garvinhicking »

milos27 wrote:In der Sitemap sind diese nicht drin aber warum crawlt dann google diese nicht exisitierenden urls? Und ist das jetzt ein Problem?
Wenn das nicht in der sitemap drin ist müsste man Google fragen woher das stammt; eventuell linken fremde Spam-Blogs auf derartige URLs.

IMHO ist das kein Problem.

Grüße,
Garvin
# Garvin Hicking (s9y Developer)
# Did I help you? Consider making me happy: http://wishes.garv.in/
# or use my PayPal account "paypal {at} supergarv (dot) de"
# My "other" hobby: http://flickr.garv.in/
milos27
Regular
Posts: 154
Joined: Sun Jul 06, 2008 8:31 pm
Contact:

Re: Crawling Fehler

Post by milos27 »

Bekomme das Problem nicht im griff ... ahbe soeben von Google folgende Meldung erhalten:

Sehr geehrter Inhaber oder Webmaster von http://www.trendlupe.de/, Beim Crawlen Ihrer Website haben wir einen Anstieg in der Anzahl der Soft 404-Fehler um etwa 2012-04-25 00:00 UTC (London, Dublin, Edinburgh) bemerkt. Auf Ihrer Website ist es möglicherweise zu Ausfällen gekommen. Es ist möglich, dass das Problem bereits behoben ist. Nachfolgend finden Sie einige Beispielseiten, die Soft 404-Fehler hervorgerufen haben:
http://www.trendlupe.de/archives/1979/08/C9.html
http://www.trendlupe.de/archives/1979/06/C13.html
http://www.trendlupe.de/archives/2004/11/C9.html
Weitere Informationen finden Sie in der Webmaster-Tools-Hilfe: Soft 404-Fehler


Ich glaube kaum das andere Seiten auf fehlerhafte Links linken, es muss doch möglich sein dieses problem beseitigen ...
garvinhicking
Core Developer
Posts: 30022
Joined: Tue Sep 16, 2003 9:45 pm
Location: Cologne, Germany
Contact:

Re: Crawling Fehler

Post by garvinhicking »

Hi!

Na dann frag doch direkt mal woher das kommt, sag dass du einen Sitemap hast in der die URLs nicht stehen, und woher der Crawler denn auf diese URLs kommt, was also der URL-Referrer ist.

Auf deiner Seite ist ja garkein Kalender eingebunden, oder? Insofern wüsste ich eh garnicht wie man manuell auf einen Link mit Archivdatum bei Dir kommen sollte...

Grüße,
Garvin
# Garvin Hicking (s9y Developer)
# Did I help you? Consider making me happy: http://wishes.garv.in/
# or use my PayPal account "paypal {at} supergarv (dot) de"
# My "other" hobby: http://flickr.garv.in/
Timbalu
Regular
Posts: 4598
Joined: Sun May 02, 2004 3:04 pm

Re: Crawling Fehler

Post by Timbalu »

Wahrscheinlich müsste man eine neue rewrite rule entwerfen, welche die URL
http://www.trendlupe.de/archives/1970/01/C1.html (200 OK, aber ungültig, da nicht vorhanden)
in
http://www.trendlupe.de/archives/C1.html (200 OK, gültig, da Kurzform von /categories/1-xxx)
umschreibt.
etwa so (ungetestet...)
RewriteRule ^archives/(/\d{4}/)/(/\d{2}/)/C(/\d{1,2}/).html index.php?url=/archives/C$3.html [NC,L,QSA]
Regards,
Ian

Serendipity Styx Edition and additional_plugins @ https://ophian.github.io/ @ https://github.com/ophian
Post Reply