POST Zugriff von Google verhindern

  • Sagt mal, vielleicht weiß das einer ja auf die Schnelle... Habe so langsam keine Lust mehr, jeden Tag Stunden was zu suchen, nur weil Google mal wieder was macht, was er nicht soll.

    Mein Problem ist, Google greift auf meinen Tracker zu und löst somit eine Zählung aus. Wie und warum das funktioniert habe ich ehrlich gesagt keine Ahnung, denn es werden auch korrekte Daten gesendet.

    Der Tracker steht im JS-File und legt einen Listener auf die Elemente der Seite. Je nachdem, was im Viewport ist, wird das Tracking ausgelöst. Dieses selbst erfolgt per POST an eine PHP-Datei, die dann in die Datenbank schreibt.

    So, nun stelle ich mir die Frage, woher Google weiß, dass er auf den Tracker per POST zugreifen muss und nicht per GET?
    Woher weiß Google, welche Daten gepostet werden müssen?
    Und warum sendet er ausgerechnet bei den Zugriffen einen Referrer, was er ja sonst NIE tut.

    Code
    66.249.76.111 - - [21/Nov/2016:12:05:20 +0100] "POST /addons/tracker/tracker.php HTTP/1.1" 204 3602 "/unterkuenfte/ort-Krummh%C3%B6rn/gemeinde-Upleward/seite_1_1.html" "Mozilla/5.0 (compatible; Googlebot/2.1; +https://beispiel.rocks/beispiel.rocks/www.google.com/bot.html)"
    
    
    66.249.76.111 - - [21/Nov/2016:12:13:28 +0100] "POST /addons/tracker/tracker.php HTTP/1.1" 204 3602 "/unterkuenfte/ort-Bredene/seite_1_1.html" "Mozilla/5.0 (compatible; Googlebot/2.1; +
    https://beispiel.rocks/beispiel.rocks/www.google.com/bot.html)"

    Einer eine Idee, wie ich Google und alle anderen, die nicht in echt über die Seite scrollen davon fern halten kann?

    Danke und Gruß

    Wenn ein Mensch nicht um dich kämpft, hat er nur gewartet, dass du gehst. ;(

  • am liebsten würde ich ja schreiben, sperr die domain für den googlebot ;) aber vermutlich reicht es wenn du das script in der robots.txt sperrst?

    Frei nach Dieter Nuhr
    Das Internet ist zum Lebensraum der Dauerbeleidigten geworden, die immer einen Grund finden, anderen irgendetwas vorzuwerfen, um sich selbst moralisch zu erhöhen.

  • Google rendert die Seite inzw. ja komplett inkl. aller Skripte. Damit werden die dann ausgeführt und dadurch kommt ja wohl das POST, welches sonst Deine Besucher auslösen. Google versucht ja schon seit langem, Seiten genauso zu rendern wie es bei Besuchern passieren würde. Du kannst nun ohne das JS zu blocken vll. einfach den Zugriff auf /addons/tracker/tracker.php per robots.txt untersagen.

  • Ha, so habe ich das nun auch mal auf die Schnelle gemacht, also den Tracker selbst blockiert. Wollte das aber eigentlich nicht machen, denn der heißt nicht immer gleich bzw. wird umbenannt zwischendurch. Und wie ich mich kenne, vergesse ich dann die robots.txt.

    Ja, dass der wie ein Besucher agiert ist mir soweit schon klar, wobei es aber nicht wirklich so ist bzw. gänzlich unklar, mit welchen Einstellungen. Ich meine z.B., da werden Elemente getrackt, die sind gar nicht im Sichtbereich (zumindest weit außerhalb meines 24-Zöllers). Das ist aber Voraussetzung. Scrollt Google etwa? Dann muss man min 3 Sekunden auf dem Element bleiben bzw. es im Viewport, erst dann wird der Track ausgelöst. Macht Google das?

    Dazu kommt noch, dass Google ja nicht auf die Seite zugreift, wo das Tracking stattfindet bzw. für die, sondern direkt einen Post an den Tracker schickt. Bei den beiden Zugriffen von oben waren es wirklich nur die beiden. Der Bot war vorher über 20 Minuten nicht auf der Seite.

    Und es macht nur der normale googlebot2.1, der mobile macht es nicht?!

    Wenn ein Mensch nicht um dich kämpft, hat er nur gewartet, dass du gehst. ;(