Die Sortierung ist Ihre geringste Sorge, was Sie beachten müssen, ist der Zeichensatz für die Spalte/Tabelle/Datenbank. Die Sortierung (Regeln, wie Daten verglichen werden und sortiert ) ist nur eine Folge davon.
MySQL unterstützt mehrere Unicode-Zeichensätze, utf8
und utf8mb4
am interessantesten zu sein. utf8
unterstützt Unicode-Zeichen im BMP
, d. h. eine Teilmenge von Unicode. utf8mb4
, verfügbar seit MySQL 5.5.3, unterstützt alle von Unicode.
Die Sortierung mit einer der Unicode-Kodierungen verwendet werden soll, ist höchstwahrscheinlich xxx_general_ci
oder xxx_unicode_ci
. Ersteres ist ein allgemeiner, sprachunabhängiger Sortier- und Vergleichsalgorithmus, letzteres ist ein vollständiger sprachunabhängiger Algorithmus, der mehr Unicode-Merkmale unterstützt (z. B. "ß" und "ss" als gleichwertig behandelt), aber dafür auch langsamer ist.
Siehe https://dev.mysql.com/ doc/refman/5.5/en/charset-unicode-sets.html .