Mysql
 sql >> Datenbank >  >> RDS >> Mysql

Auswählen der Tabellensortierung für universelle Zeichen

  • ...general_ci Ist einfach. Kombinationen aus 2 Zeichen (z. B. mit einem Zeichen ohne Leerzeichen) werden nicht mit dem Äquivalent aus einem Zeichen gleichgesetzt.

  • ...unicode_520_ci stammt aus der Unicode-Version 5.20, der neuesten Version, die verfügbar war, als MySQL sie aufgegriffen hat. Es handhabt Dinge wie eine Bestellung für Emoji, die frühere Versionen nicht hatten.

  • Bei MySQL 8.0 ist die bevorzugte Sortierung utf8mb4_0900_ai_ci , basierend auf Unicode 9.0.

  • ...<language>_ci behandelt Variationen, die in der gegebenen Sprache gefunden werden. Zum Beispiel sollte ch und ll werden im Spanischen als "Buchstaben" behandelt und zwischen cz sortiert und d , und lz und m .

  • Verwenden Sie für den allgemeinen Gebrauch nicht ...general_ci , verwenden Sie die neueste von Unicode abgeleitete Version. Wählen Sie für sprachspezifische Situationen eine der anderen Sortierungen aus.

  • Ich weiß, wie (oder sogar ob) Chinesisch und Arabisch in den verschiedenen Sortierungen unterschiedlich sortiert werden. Ich sehe jedoch ...persion_ci , also vermute ich, dass es ein Problem gibt.

  • Verwenden Sie utf8mb4 , nicht utf8 , zumal Sie Chinesisch brauchen.