So, ich stehe hier anscheinend vor einem für mich unlösbarem Problem, dank der Google Datensammelwut. Ich habe hier einen Kundenbereich und möchte nicht, dass irgendwelche URLs von dort im Index erscheinen.
Leider funktioniert das nicht und es sind dennoch welche zu finden, da einige Kunden Direktlinks dort hin gesetzt haben und Google diesen natürlich folgt.
Nur das Problem ist jetzt, dass ich die aus dem Index raus haben will und auch nie wieder dort sehen will. Nur wie?
Meine Loginseite, auf die Google offiziell zugreifen kann, habe ich mit noindex versehen. Das funktioniert auch. Google beachtet es und nimmt sie nicht auf.
Das Problem sind aber die Unterseiten, auf die Google über irgendwelche Links kommt. Google folgt also dem Link, mein System prüft den Login und stellt fest, dass er fehlt. Leitet dann weiter an die Loginseite. Google nimmt dennoch die Unterseite in den Index auf!
Versehen ist alles außer dem Loginformular per robots.txt mit "Disallow: /".
Die robots.txt verhindert nun aber nicht die Aufnahme, denn im Index sind sie mit "Aufgrund der robots.txt dieser Website ist keine Beschreibung für dieses Ergebnis verfügbar. Weitere Informationen".
Einen "noindex" kann ich an der Stelle gar nicht setzten, da Google auf Grund des fehlenden Logins ja gar nicht auf die Seite selbst kommt.
So, wie bekomme ich es nun sicher, zuverlässig und ohne ständige Anpassungen hin, dass Google definitiv die Finger von den Seiten lässt ??