Ja, das ist richtig. UTF-8 ist eine Kodierung für den Unicode-Zeichensatz, der so ziemlich jede Sprache der Welt unterstützt.
Ich denke, der einzige Unterschied liegt in der Sortierung Ihrer Ergebnisse, verschiedene Buchstaben können in anderen Sprachen in einer anderen Reihenfolge auftreten (Akzente, Umlaute usw.). Auch das Vergleichen von a
zu ä
kann sich in einer anderen Sortierung anders verhalten.
Der _ci
Suffix bedeutet Sortierung und Vergleich erfolgt c wie ich unsensibel.
http://www.collation-charts.org/ könnte Sie interessieren.