thilo hat geschrieben:Jetzt habe ich eine leere 4.9.7 installiert - klappt einwandfrei mit kyrillischen Texten.
Gut
- Update von meiner 4.9.6 auf 4.9.7 -> kyrillisch werden "???" angezeigt.
Nicht gut
- händisch in der Datenbank sämtliche Kollationen auf UTF-8 gesetzt -> kyrillisch werden "???" angezeigt.
Hm..., das passt zu dem was ich zuvor erklärt hatte mit der Kollation: Die Kollation ist nur die Zuordnung der Zeichen zu einem Charaktersatz, aber es ändert die Zeichen nicht.
Die ??? heißen doch nur, dass für diese Zeichen kein Pendant im Charaktersatz gefunden wurde.
Angenommen ein Zeichen wurde in den Ersatzzeichen für kyrillisch in der Datenbank angelegt, dann sieht das vielleicht so aus: ü
Zumindest sehen die Zeichen so in einer Wordpress-Datenbank aus, wenn Wordpress utf-8 ist und die Datenbank Latin-1.
Das ist noch kein Problem, denn die Datenbank gibt die Information mit, dass dieses ü einem bestimmten Charaktersatz zu zu ordnen sein und dann kann das auch richtig angezeigt werden.
Wenn nun aber die Kollation in der DB veärndert wird, stimmt die ursprüngliche Zuordnung nicht mehr und aus ü wird ???
Dein Problem ist, die Daten in der Datenbank müssen stimmen, in dem Fall utf-8 oder bei Latin-1 die Ersatzzeichen ü sein.
Daraus folgt ...
Heißt das jetzt, dass ich aufgrund des Bugs in der 4.9.6 die komplette Webseite in 4.9.7 nochmal hochziehen muss und sämtliche Inhalte via copy & paste rüberziehen muss? Das sind Tage an Arbeit....
ja, so ähnlich.
Zum Beispiel beim Umwandeln von Programmdateien von Ansi in utf-8 muss man auch alle Sonderzeichen wie Ξ neu schreiben, weil sie danach als ähnlich wie ö erscheinen.
Und nach der Korrektur wieder als utf-8 abspeichern. Einfach nur umwandeln des Dokumentes geht nicht.
Es gibt scheints eine Möglichkeit, solche ö wieder richtig umzuwandeln, aber wenn es mal ??? sind, ist es weder der eine noch der andere Zeichensatz, dann ist es doppelt gemoppelt oder noch etwas Drittes.
... meine Meinung zumindest
Edit:
http://www.sebastianviereck.de/mysql-ph ... -utf8-iso/
"Stattdessen zeigt der Browser kleine Rechtecke oder Fragezeichen an, etwa □□ oder ?? statt 北京. Hier fehlen Schriftarten"
http://de.wikipedia.org/wiki/Hilfe:UTF-8-Probleme