Nicht mehr existente URL aus Google-Index entfernen?

  • Hallo liebe Gemeinde,

    ich brauche mal wieder Eueren Ratschlag. Ich habe folgendes Problem.
    Ich nutze auf meiner Seite eine Kurs-Komponente, die je nach Datum und gewähltem Kalender eine dynamische URL bereitstellt. Nun hat Google irgendwann vor Monaten ein paar URLs indexiert, die es heute gar nicht mehr gibt, da es zum einen den Kalender gar nicht mehr gibt (die Komponente dazu aber schon), zum anderen ist das Datum natürlich auch lange vorbei.

    Für die aktuellen Kurse habe ich das im Griff, aber ein paar alte URLs bekomme ich nicht mehr aus dem Index. In der alten Search Console kann ich zwar URL's entfernen, aber das ist nur temporär. In meiner Verzweiflung habe ich nun in der Robots einen immer wiederkehrenden Teil der betroffenen URL's (den Namen des alten Kalenders) als Disallow hinzugefügt. Nun geht Google zwar nicht mehr schauen, meckert aber, dass Google URLs im Index führt, die lt. Robots ausgeschlossen sind.

    Ich kann die alten URLs nicht wieder generieren, das geht einfach nicht. Wie kann ich denn aber doch die alten URL's aus dem Index bekommen und das Problem loswerden?

  • Disallow kann nicht funktionieren, weil der Bot ja nicht drauf darf. Noindex wäre da der richtige Weg, hieße für den Google-Bot dann, drauf und rausschmeißen.

    Er war Jurist und auch sonst von mäßigem Verstand.

    (Volker Pispers)

  • Das würde ich ja gerne tun, dafür muss die URL aber wenigstens einmal wieder erreichbar sein, ist sie aber nicht und ich kann sie auch nicht wieder erreichbar machen, da die indexierte URL auch einen Hash-Wert enthält und so aussieht:

    ht tps://w http://ww.meineadresse.de/index.php/bild…ndar&Itemid=726


    Weder gibt es noch "alle-bildungsangebote" aus der URL, der Kalender ist einfach nicht mehr vorhanden, noch gibt es den Kurs noch und schon dreimal nicht den Hash in der URL, das ist alles nicht mehr reproduzierbar. Sonst hätte ich die schon längst wieder erreichbar gemacht und ein NOINDEX rausgeschoben.

  • Moment, von was redest Du hier überhaupt? Du sagst nicht mehr erreichbar, nicht mehr möglich, aber im Index? Was sendet die Seite denn? Und die andere Frage ist, was Du genau erreichen willst....

    Aktuell leitet die Seite von oben weiter an https://beispiel.rocks/www.euraka-exklusiv.de/bildu...iterausbildung , was natürlich quatsch ist, so einen nicht mehr vorhandenen Murks an eine andere Seite weiterzuleiten.

    Da muss ein 404 oder ein 410 kommen. Noindex wäre auch möglich, aber die Notlösung. 404 oder 410 sind die richtige Wahl, denn wie die besagen, "gibt es nicht mehr".

    Durch Deine Weiterleitung sagst Du ja extra, "die Seite gibt es, aber wo anders". Ein "noindex" wäre auch nur ein "gibt es zwar, aber bitte nicht indexieren". Das ist aber nur ein Vorschlag, keine verpflichtende Anweisung.

    Aus der GSC werden die 404 oder 410 aber erst mal dann auch nicht verschwinden. Google ruft die immer wieder ab, in der Hoffnung, dass die doch wieder da sind.

    Ach ja, im Index kann ich die gar nicht finden, daher die Frage am Anfang, was Du meinst.

    Wenn ein Mensch nicht um dich kämpft, hat er nur gewartet, dass du gehst. ;(

  • Also bis heute morgen gab es den Kurs nicht mehr. Da erschien tatsächlich eine Fehlermeldung. Und zwar eine von der Kurskomponente, keine 404 vom CMS. Ich habe es nun so gelöst, dass ich den Kurs wieder eingetragen habe, damit ist die Seite korrekt, der Buchungsseite habe ich aber ein NOINDEX und NOFOLLOW hinterlegt. Damit sollte Google die Seite nun wieder abrufen können und auf das NOINDEX und NOFOLLOW stoßen.