-
...general_ci
Ist einfach. Kombinationen aus 2 Zeichen (z. B. mit einem Zeichen ohne Leerzeichen) werden nicht mit dem Äquivalent aus einem Zeichen gleichgesetzt. -
...unicode_520_ci
stammt aus der Unicode-Version 5.20, der neuesten Version, die verfügbar war, als MySQL sie aufgegriffen hat. Es handhabt Dinge wie eine Bestellung für Emoji, die frühere Versionen nicht hatten. -
Bei MySQL 8.0 ist die bevorzugte Sortierung
utf8mb4_0900_ai_ci
, basierend auf Unicode 9.0. -
...<language>_ci
behandelt Variationen, die in der gegebenen Sprache gefunden werden. Zum Beispiel solltech
undll
werden im Spanischen als "Buchstaben" behandelt und zwischencz
sortiert undd
, undlz
undm
. -
Verwenden Sie für den allgemeinen Gebrauch nicht
...general_ci
, verwenden Sie die neueste von Unicode abgeleitete Version. Wählen Sie für sprachspezifische Situationen eine der anderen Sortierungen aus. -
Ich weiß, wie (oder sogar ob) Chinesisch und Arabisch in den verschiedenen Sortierungen unterschiedlich sortiert werden. Ich sehe jedoch
...persion_ci
, also vermute ich, dass es ein Problem gibt. -
Verwenden Sie
utf8mb4
, nichtutf8
, zumal Sie Chinesisch brauchen.