Also so in etwa, wie es im Titel steht. Es geht um irgendwelche Sonderzeichen, Icons oder weiß der Geier was, das Leute da aus Word in Eingabeformular kopieren und die Webseite das dann nicht darstellen kann.
Schaut dann so aus:
Fehlermeldung vom W3C-Validator:
"Document uses the Unicode Private Use Area(s), which should not be used in publicly exchanged documents. (Charmod C073)"
Lässt sich das irgendwie unterbinden? Also so im Sinne von, schmeiß alles raus, was nicht im UTF8 enthalten ist?
Ich weiß, dass man Zeichen per RegEx ganz einfach festlegen kann, also a-z oder 0-9 etc. Aber das ist zu fehleranfällig, denn es gibt so viele in den verschiedenen Sprachen, die ich quasi alle irgendwie freigeben müsste. Daher die Frage, ob das nicht auch einfach über Zeichensatz geht. "Alles was nicht UTF8 ist, löschen".