Google nervt mit falschen URLs

  • Hi zusammen :)

    Sagt mal, gibt es irgend einen Weg herauszufinden, wo der Bot eine URL her hat, die der da aufruft? Ich frage daher, da Google seit Tagen URLs bei mir aufruft die weitergeleitet werden (den Ursprung gab es aber noch nie) und zugleich auch welche aufruft, die einfach nicht stimmen. Auch diese gibt es in meinem System nicht und gab es noch nie!

    z.B.


    Also immer der selbe Ort, aber immer ein anderes Land.

    Ich habe nun schon Sitemapgeneratoren, Xenu und sonst was über die Domain laufen lassen und diese URLs gibt es dort definitiv nicht. Den Ort schon, die Länder auch, aber nicht in dieser Zusammensetzung!

    In den WMT steht rein gar nichts. Früher gab es da mal einen Punkt wegen Weiterleitungen, aber den gibt es nun auch nicht mehr.

    Wie bekommt man denn nun raus, wo Google diese URLs her hat?

    Wenn ein Mensch nicht um dich kämpft, hat er nur gewartet, dass du gehst. ;(

  • in den Webmastertools unter nicht gefundene Seiten.
    Micht nervt da auch, dass links von alten nicht mehr existierenden Seiten als Ursache angezeigt werden. Selbst das "behoben" ändert da nichts dran.

    Frei nach Dieter Nuhr
    Das Internet ist zum Lebensraum der Dauerbeleidigten geworden, die immer einen Grund finden, anderen irgendetwas vorzuwerfen, um sich selbst moralisch zu erhöhen.

  • guppy
    ok, schlecht ausgedrückt.

    In den WMT steht zu den Weiterleitungen nichts. Wo hat Google die URL her?
    Zu den 404 steht dort was, keine Frage, aber bei den meisten eben keine Herkunft / verlinkte Seite.

    Das mit den alten Seiten nervt mich auch, aber die da jetzt gab es definitiv noch nie.

    Wenn ein Mensch nicht um dich kämpft, hat er nur gewartet, dass du gehst. ;(

  • Könnte es an dem must-revalidate des 301 liegen?

    Der könnte von Google so interpretiert werden:

    es soll "permanent" auf xyz geleitet werden, aber bitte frage das beim nächsten mal nach...

  • Chris, das ist eine gute Frage. Das hab ich schon immer drinnen und die wirklichen Weiterleitungen funktionieren ja, also Seiten die ich umgezogen habe.

    Erinnerst Du Dich noch, an die Geschichte damals mit den seltsamen URLs in den WMT? Da hatte ich ja dann das Script per default so geändert, dass die an eine Alternative weitergeleitet werden. Genau diese Weiterleitung geht Google nun auch, nur dass die Ursprungsseite nie existierte. Z.B. Kombinationen aus Land + Bundesland + Ort. Das stimmt so gesehen alles, die gehören auch alle zusammen, doch auf der Domain gab es nie Bundesländer. Die habe ich nur auf einer und dort auch nur als "Altbestand".

    Genauso am Ende der URL das seite_1_1.html. Bei machen habe ich da seite-1-1.html und Google ruft die nun hier auch auf - was dann weitergeleitet wird. Wenn das mal ein falscher Link wäre, gut, dann hab ich mich irgendwo vertippt bei einer Link-URL, aber das sind ja extrem viele. Und die kommen alle vom System und aus der Config (keine manuellen Links). Also entweder sind alle falsch oder keiner davon. Und es ist: keiner.

    Irgendwie habe ich das Gefühlt - und das schon länger - dass Google hier Domänen vermischt. Oder Google will mich verarschen. Das ganze begann am ca. am 26.4. inkl. lauter soft-404-Meldungen, wo aber gar keine sind - da ist nix, das sind normale Seite mit Status 200.

    Mir geht es also nicht um die Weiterleitung an sich, denn die tut was sie soll - sondern darum, wo Google her kommt. Hab nun wieder 600 Einträge durchsehen dürfen, nur um einen "PHP-Notice" und ein "Undefined Index" zu finden und genau wegen solchen Meldungen oder falschen Weiterleitungen (Fehler im System) mache ich das überhaupt.

    Edit: War eben im Hof Unkraut zupfen... Vorhin habe ich noch was gelesen und das könnte es vielleicht sein. In der Hilfe steht was von "unerwartete 404-Meldungen". Da geht es darum, dass Google Javascripte auswertet und andere Dokumente, in denen URLs oder Bestandteile stehen und Google diese dann fälschlicherweise an eine gültige URL anhängt, was zu einem Fehler führt. Hatte ich schon mit Piwik. Da stand im Script nur piwikurl = pkstat.php und Google hat die Datei dann an jede URL angehängt.

    In der Hilfe steht auch was zur Problembeseitigung... "Google arbeitet daran".. Toll... Man soll nach echten Fehlern Ausschau halten und die falschen einfach ignorieren. Einfacher gesagt als getan, wenn auf einen echten Fehler gefühlte 1000 falsche kommen.

    Edit:
    So, das kam die letzten 5 Minuten an Weiterleitungen rein:

    /unterkuenfte/bundesland-Schleswig-Holstein/region-Nordsee/...
    Bundesland zu viel

    .../art-Ferienwohnungen/region-westerwald/seite-1-1.html
    Falscher Trenner der Seite

    /unterkuenfte/ort-Friedrichskoog/seite_2_1.html
    Der stimmt mal wirklich. Wird weitergeleitet, da es Seite 2 nicht mehr gibt

    /unterkuenfte/art-ferienwohnungen/land-Deutschland/...
    Hier stimmt die Schreibweise nicht. "F" anstatt "f"

    Edit 2:
    Hm, habe ich das vorhin nicht mit der willkürlich angehängten Datei geschrieben ??

    Gerade gekommen:
    /unterkuenfte/region-Ostsee/google-plusone-sprite.png
    /unterkuenfte/region-Ostsee/facebook-like-sprite.png

    Die beiden PNG liegen in einem ganz anderen Unterordner und sind über eine .css als Hintergrundbild eingebunden.

    So, gleich noch eine Frage hinterher, da mir nun noch was aufgefallen ist....
    Was zum Geier ist denn das da??
    Äm, nee, in einen neuen Thread...

    Wenn ein Mensch nicht um dich kämpft, hat er nur gewartet, dass du gehst. ;(