PostgreSQL
 sql >> Datenbank >  >> RDS >> PostgreSQL

Postgresql-Regex zur Übereinstimmung mit Großbuchstaben, Unicode-fähig

Die Regexp-Engine von PG 9.1 und älteren Versionen klassifiziert Zeichen nicht korrekt, deren Codepunkt nicht um ein Byte passt. Der Codepunkt von 'Ó' 211 ist es richtig, aber der Codepunkt von 'Ą' ist 260, jenseits von 255.

PG 9.2 ist darin besser, aber immer noch nicht 100% richtig für alle Alphabete. Siehe dieses commit im PostgreSQL-Quellcode, und insbesondere diese Teile des Kommentars:

und

Leider wurde dies nicht auf 9.1 zurückportiert