"Textausschlnitt" wird nicht gefunden

  • Hi zusammen,

    bevor ich nun noch länger rumsuche nun direkt mal die Frage. Diesmal aber ohne URL, die Infos müssen reichen ;)

    Man nehme:
    Eine Webseite mit vielen Informationen in Textform. Nicht groß, nur ca. 30 Unterseiten. Alle sind im Index, alle werden gefunden, auch bei Auszügen aus dem Text.

    Soweit alles normal.

    Nun hatte ich bei einer Unterseite weitere Bilder eingefügt. Diese Bilder jeweils mit einer Unterüberschrift als h4 und einer kurzen Beschreibung.
    -> Folge: Seite weiterhin im Index, aber Textausschnitte werden nicht mehr gefunden.

    Ok, dachte mir, dass da was mit den Überschriften h4 nicht passt.

    Nächste Unterseite genommen. Dort auch Bilder eingebunden. Wieder mit Überschrift (diesmal aber als normaler "span" und kein "h4") und ebenso wieder mit Kurzbeschreibung zu jedem Bild.
    -> Folge: Seite weiterhin im Index, aber Textausschnitte werden nicht mehr gefunden.

    Also, an den h4 lag es wohl nicht, denn die gibt es auf der zweiten Seite nicht. Neuer Verdacht, die Keyworddichte ist zu hoch.

    Also nächster Versuch. Neue Unterseite und wieder Bilder eingebunden, diesmal aber ohne Untertitel und ohne Beschreibung. Ebenso die Bilder ohne "title" und ohne "alt". Also keine Änderung am Textinhalt (Erweiterung durch Beschreibungen), nur die Bilder selbst sind eingebunden.
    -> Folge: Seite weiterhin im Index, aber Textausschnitte werden nicht mehr gefunden.

    Herrje. Was kann das denn nun sein?

    h4 nicht wirklich, da auf der zweiten Seite die nicht waren. Keyworddichte durch die Bildbeschreibungen auch nicht, denn die gibt es auf der dritten Seite nicht.

    Dennoch, auf drei Seiten Bilder hinzugefügt und alle drei Seiten sind nicht mit über einen "Textausschnitt" zu finden. Wie gesagt, im Index sind sie weiterhin. Bei den normalen Keys werden die auch gefunden, nur nicht bei einem kurzen Auszug aus dem Text, weder mit noch mit ohne "Anführungszeichen". Alle anderen Seiten, auf denen ich keine Bilder hinzugefügt habe, sind weiterhin zu finden wie die Jahre zuvor auch.

    Hat jemand eine Idee in welche Richtung ich da suchen müsste?

    Wenn ein Mensch nicht um dich kämpft, hat er nur gewartet, dass du gehst. ;(

  • Hast Du bei diesen Seiten irgendwie versucht, die Bilder vor dem Indexieren zu sperren (irgendwann hattest Du da mal was)?

    Vll. bekommt Google es durcheinander und verweigert sich nun, den Inhalt der Seite zu indexieren, wenn zum indexieren gesperrte Bilder drauf sind?

  • wenn ich es so lese würde ich entweder auf dc tippen, oder dass der h4 an der falschen Stelle geschlossen wurde, also nach dem img tag.
    Allerdings schließe ich so was bei Synonym aus ;).

    Frei nach Dieter Nuhr
    Das Internet ist zum Lebensraum der Dauerbeleidigten geworden, die immer einen Grund finden, anderen irgendetwas vorzuwerfen, um sich selbst moralisch zu erhöhen.

  • Chris
    Also bei der Domain war nix gesperrt, nie. Da gibt es auch keine Subdomänen für Bilder oder so, das ist alles auf anderen Systemen. Hier ist es nun eine normale HTML-Seite mit ganz normal eingebundenen Bildern und Texten.

    guppy
    Nee, ich habe da für mich selbst gar nichts ausgeschlossen.

    Also nochmal kurz zusammengefasst. 3 unterschiedliche Seiten. Vom Aufbau her Text mit je 2-3 Bildern drinnen. Alle im Index, alle auffindbar.

    Änderungen im Abstand von mehreren Wochen.
    1. Seite: Bilder hinzugefügt in Form von:

    Code
    <div class="thumbnail">
    	<a href="/bilder/bild-gross.jpg" rel="lightbox[set]" title="Hier der Titel"><img src="/bilder/bild-klein.jpg" width="200" height="150" title="Hier der Titel" alt="Eine Kurzbeschreibung" /></a>
    	<h4>Hier der Titel</h4>
    	<span class="desc">Eine Kurzbeschreibung</span>
    </div>


    -> Nicht mehr zu finden

    2. Seite: h4 ersetzt

    Code
    <div class="thumbnail">
    	<a href="/bilder/bild-gross.jpg" rel="lightbox[set]" title="Hier der Titel"><img src="/bilder/bild-klein.jpg" width="200" height="150" title="Hier der Titel" alt="Eine Kurzbeschreibung" /></a>
    	<span class"h4">Hier der Titel</span>
    	<span class="desc">Eine Kurzbeschreibung</span>
    </div>


    -> Nicht mehr zu finden

    3. Seite: Ohne Texte, Überschriften, Title und alt

    Code
    <div class="thumbnail">
    	<a href="/bilder/bild-gross.jpg" rel="lightbox[set]"><img src="/bilder/bild-klein.jpg" width="200" height="150" alt="" /></a>
    </div>


    -> Nicht mehr zu finden.

    Also vor allem bei Seite 3 ist ja nichts, was falsch sein könnte. Da ist nur das Bild und eben das verlinkte größere Bild. Keine Beschreibungen, keine Titel, nichts.

    Diesen Thumbnail-Block habe ich auch schon mehrfach auf Domänen und bei keiner hab ich so was bemerkt.

    Das einzige was mir jetzt noch so einfällt ist die Anzahl. Das sind etwa 10-20 Bilder wo ich hinzugefügt habe, aber daran darf es doch nicht scheitern, oder doch?

    Äm Nachtrag: DC, nee, ist da keiner zu finden. Und Google sagt ja auch:

    Zitat

    Keine Ergebnisse für "egal welchen Abschnitt ich nehme" gefunden

    Wenn ein Mensch nicht um dich kämpft, hat er nur gewartet, dass du gehst. ;(

  • ^^ das hört sich jetzt irgendwie ironisch an, aber genau so schaut es aus!

    Allerdings ist das bei vielen anderen Seiten ja auch so, etwa bei Schnipsel oder bei meinen anderen und da wird der Text auch nicht "vergessen".

    So, musste ich mir aber nun mal direkt ansehen. Andere Domain, gleicher Bildercontainer und dort werden die Texte gefunden. Suche etwa nach "Ab der 2. Woche dürfen Sie auch einmal kostenlos mit mir segeln" (sind aber nur 8 Bilder).

    Aber... Mach mich nicht kirre. Hab nun noch drei andere Galerien angesehen, eine mit 17 Bildern, eine mit 25 und eine mit 54. Alle drei sind im Cache und im Index, keine ist über den "Auszugstext" zu finden. Also genau identisch mit dem Problem auf der eigentlichen Seite....

    Anzahl Bilder??? Kann das wirklich sein? Das ist das einzige was bei allen identisch (hoch) ist. Die Unterüberschriften / Bildbeschreibungen / Title und Alt sind ja nicht überall.

    Wenn ein Mensch nicht um dich kämpft, hat er nur gewartet, dass du gehst. ;(

  • Nachtrag... Mal eben bei Margin nachgesehen. Dort sind 35 Bilder auf der Seite und die Texte werden gefunden.... Also doch nicht.

    Und noch als Anmerkung. Die Bildcontainer-Struktur ist von Margin, also die funktioniert an sich schon. Bis zum 21.3. war die Seite 3 auch noch normal zu finden. War ja eben auch ein Test, daher geprüft vorher. Bilder wurden dann am 21.3. eingebunden. Am 22.3. wurde der Cache aktualisiert. Gestern Mittag war sie auch noch zu finden, heute Morgen war sie weg.

    Wenn ein Mensch nicht um dich kämpft, hat er nur gewartet, dass du gehst. ;(

  • Das hat absolut nichts mit der Anzahl der Bilder zu tun. Ich hab Galerien mit über 50 Bildern und einem kurzen Text, das wird auch gefunden. Schick mal eine betroffene Seite per PN

  • ^^ das glaube ich fast auch... Lauter Sachen die ich mir nicht erklären kann und immer auf anderen Domänen. Bin schon gespannt in 3-4 Wochen, wenn die nächste Bilderserie online geht / gehen soll. Die Unterseite ist auch noch da. Wenn dem so ist wie jetzt, dann ist die 2-3 Tage später auch "weg". Kirre macht mich ja eigentlich noch nicht mal, dass die "weg" ist. Sondern viel mehr, dass die im Index ist, die Hauptsuchbegriffe alle funktionieren, die Besucheranzahl steigt, aber eben "Satzteile" nicht mehr zu finden sind. << das macht einfach keinen Sinn.

    Hab die Seite vor 3 Wochen auch extra in den WMT angemeldet um dort eventuell was zu sehen. Nichts, gar nichts. Ein so sauberes WMT hatte ich noch nie. Keine Hinweise wegen Titel / Description, keine Robots-Fehler, keine DNS-Fehler und keine 404er. Einfach gar nichts.

    Ich bin schon kurz davor die Bilder wieder zu entfernen... Was anderes wurde ja nicht gemacht :(

    Ich suche mich ja schon dämlich. Komme mir doof vor und stehe wie ne Kuh vor verschlossenem Stall.

    Eine suche nach dem "<title>" funktioniert, aber nur ohne Anführungszeichen.

    Nach H1, H2 oder Content hingegen nicht.

    Wenn ein Mensch nicht um dich kämpft, hat er nur gewartet, dass du gehst. ;(

  • Ich glaube, ich muss mir mal die Seite (URL bitte per PM) anschauen.

    Hast Du in den WMT die Vorschau probiert?

    Vll. rendert Google die Seite so, dass die Bilder die Texte überdecken und meint daher, der Textinhalt wäre verdeckt, daher für Nutzer nicht zu sehen, daher wollen sie Dich zu den Textinhalten nicht anzeigen...

  • Weitere Möglichkeit: die Seite ist codetechnisch so groß und der Textinhalt im hinteren Teil der Datei, so dass der Crawler es abschneidet beim Speichern/Verarbeiten?

    So sah es glaube ich um 2003 eventuell mal aus, aber inzw. kann ich mir das kaum vorstellen...

  • Chris
    Ich schick sie Dir auch mal.
    Der Inhalt ist im vorderen Bereich vom Quelltext.

    Header
    Inhalt
    Bilder
    Navi
    Footer

    Und ja, den Test in den WMT hab ich auch gemacht. Alles normal. Nichts zu sehen.

    Wenn ein Mensch nicht um dich kämpft, hat er nur gewartet, dass du gehst. ;(

  • Hm, also onpage, css mäßig robots.txt mäßig nichts gefunden.

    Hast Du in der Zwischenzeit etwas an der Serverkonfiguration geändert?

    Wie sieht es mit gzip aus (vll. so gezippt, dass es SuMas nicht entpacken können?), wie sieht es mit Bots aus? (sehe zB dass einigen Tools anscheinend der Zugriff gesperrt ist, vll. ausversehen auch den Google Bots?)

  • Zitat

    Hm, also onpage, css mäßig robots.txt mäßig nichts gefunden.


    Schade. Hätte mich schon gefreut, wenn da ein Fehler gewesen wäre :)

    Zitat

    Hast Du in der Zwischenzeit etwas an der Serverkonfiguration geändert?


    Nein. Die letzte Änderung ist ca. 2 Jahre her. So lange lag die Seite auch ohne Änderungen.

    Zitat

    Wie sieht es mit gzip aus (vll. so gezippt, dass es SuMas nicht entpacken können?), wie sieht es mit Bots aus? (sehe zB dass einigen Tools anscheinend der Zugriff gesperrt ist, vll. ausversehen auch den Google Bots?)


    Also gzip ist aktiviert, aber das on-the-fly vom Apache. Google meldet keine Probleme in den WMT beim "Zugriff wie durch Google-Bot". Der stellt dort den Quelltext richtig dar.

    Nein, der Google-Bot kann zugreifen. Einige Tools sind gesperrt, das ist die Bottrap. Aber der Abruf aus den WMT geht, die Seite ist ja auch im Index, der Cache ist vorhanden. Ist ja alles da.

    Sucht man nach site:domain.de "Textausschnitt", dann gibt es auch einen Treffer, nur nicht "normal" ohne "site".

    Also Google kann zugreifen, kennt den Inhalt, liefert die Seite bei normalen Suchbegriffen aus. Alles normal. Nur die Suche nach "Satzbestandteilen" nicht. Diese funktioniert nur auf allen anderen Seiten ohne den Bildern.

    Wenn ein Mensch nicht um dich kämpft, hat er nur gewartet, dass du gehst. ;(

  • Dann ist es vermutlich tatsächlich ein "wenig Trust" Filter, weil durch die Bildbeschreibungen zuviel Keys auftauchen. Gefunden wirst Du dann nur noch aufgrund der OffPage Faktoren.

    Oder die Textinhalte Deiner Seite werden bei Google immer genau auf jenen Servern gespeichert, die durch nen Nager angefressen wurden :D

  • Also wegen der Keydichte. Das, bzw. die h4, war ja meine Vermutung bei Seite 1 (Bilder eingefügt Ende Februar). Daher dann ca. am 8.3. die 2. Seite ohne hx. Als das auch das gleiche war nun Seite 3. Da hab ich ja aber gar keine Beschreibungen eingefügt, nur die Bilder ganz unten. Das andere war schon vorher da.

    FB und G+, auch das ist schon ca. 1,5 Jahre drinnen. Die Scripte sind auch schon ewig drinnen. Geändert wurden wirklich nur die Bilder.

    Und das "nicht mehr auffindbar" kam ja auch nicht bei allen von jetzt auf gleich, sondern bei jeder Seite etwa 2-3 Tage nach dem Einfügen der Bilder. Also erst war 1 "weg", dann 2 und nun seit heute 3.

    In ein paar Wochen kommt Seite 4... Nur das traue ich mich jetzt schon nicht mehr wirklich, weil ich keinen Grund sehen kann.

    Wenn ein Mensch nicht um dich kämpft, hat er nur gewartet, dass du gehst. ;(

  • Das könnte natürlich sein. Wobei mir da eine Frage aufkommt... Welchen Sinn macht das dann genau? Bei normalen Suchanfragen wird sie je gefunden und stellt fast täglich neue Besucherrekorde auf. Ist doch irgendwie unlogisch, oder?

    Wenn ein Mensch nicht um dich kämpft, hat er nur gewartet, dass du gehst. ;(