W3C: Forbidden code point U+0084 und U+0093

  • Also ich gehe mal davon aus, dass ich da mal wieder einen Bug gefunden habe, denn.... Habe mir nun meinen eigenen XML-Feed gebaut und lasse den zwei mal ausgeben. Erst die Rohdaten per var_dump() und beim zweiten mal den Feed erst durch simplexml_load_string() jagen um damit in PHP arbeiten zu können und dann einen var_dump().

    Ergibt:

    string(439) " Die Blutberberitzen-Hecke hat „gleich“ mehrere Vorteile: Sie schmückt sich im Juni mit gelben Blüten, trägt im Herbst.... "

    ^^ Hier stimmt also alles, die „gleich“ sind da.


    object(SimpleXMLElement)#11 (1) { ["desc"]=> string(126) "Die Blutberberitzen-Hecke hat gleich mehrere Vorteile: Sie schmückt sich im Juni mit gelben Blüten, trägt im Herbst...." }

    ^^ und hier sind sie nun weg im Quelltext stehen wieder die Quadrate.

    Also kann es ja eigentlich nur an simplexml_load_string() liegen ????

    Wenn ein Mensch nicht um dich kämpft, hat er nur gewartet, dass du gehst. ;(

  • Leider nicht, aber danke. Das da geht genau in die andere Richtung. Ich bin nun aber wirklich der Meinung, dass es am simplexml_load_string() liegt, denn mit anderen Funktionen passiert das nicht. Und, es geht nicht nur um die beiden Zeichen, sondern alle aus dem Unicode Block "Latin-1 Supplement", also x80 bis xFF. Keines davon wird mehr richtig angezeigt, wenn ich es durch die Funktion jage. Habe nun auch ein paar andere gefunden, die das gleiche Problem haben. Allerdings gab es da keine Lösung und die Post waren aus dem Jahre 2009!

    Ich lasse das nun aber auch gut sein, denn es wurde noch seltsamer. Das Falsche, nicht sichtbare Zeichen wenn ich kopiere und in den Editor einfüge, dann ist das dort auch nicht zu sehen. Wechsle ich dann in den HEX-Modus, dann steht das dort aber als "C2 84" drinnen, würde also passen.

    Ging dann her und habe das Zeichen, das richtig auf der Webseite angezeigt wird, kopiert und eingefügt in den Editor. Das wird mir dort dann auch richtig angezeigt. Schalte ich nun aber um auf HEX-Modus, dann bekomme ich die Werte "E2 80 9E".

    Aber, beides entspricht, je nach Seite wo man nachsieht, dem Zeichen "DOUBLE LOW-9 QUOTATION MARK"

    Wenn ein Mensch nicht um dich kämpft, hat er nur gewartet, dass du gehst. ;(