Java kann ALLEN gültigen Unicode-Text speichern. Es verwendet intern UTF-16.
Wenn Sie den gesamten Datenpfad korrekt konfigurieren, bleibt der gesamte Text erhalten. Sie müssen Folgendes sicherstellen:
- Der korrekte String erreicht Java (bei Webanwendungen die Zeichenkodierung des übermittelten Formulars).
- Java weiß, dass es mit der Datenbank in UTF-8 kommunizieren sollte, und die Datenbank weiß, dass es UTF-8 über die Verbindung erwarten sollte. Dies stellen Sie beim Einrichten der Datenbankverbindung sicher.
- Daten werden als UTF-8 in der Datenbank gespeichert.
Beachten Sie, dass [die Dokumentation für MySQL] Ansprüche UTF-8 ist nicht in der Lage, Zeichen außerhalb der Basic Multilingual Plane zu speichern (alle "normalen" Zeichen liegen innerhalb von BMP). UTF-8 selbst ist perfekt in der Lage, alle Unicode-Zeichen zu speichern, und die Datenbank sollte auch in der Lage sein, diese Zeichen zu codieren.
Java selbst ist in Ordnung - denken Sie nur daran, dass einige seltene Unicode-Zeichen eigentlich zwei Zeichen sind (genannt Ersatzpaar ) in Java.