PostgreSQL
 sql >> Datenbank >  >> RDS >> PostgreSQL

Postgresql-Volltextsuche für die tschechische Sprache (keine Standard-Sprachkonfiguration)

Ich habe es noch nie versucht, aber Sie sollten in der Lage sein, einen tschechischen Snowball-Stemmer zu erstellen, solange Sie bereit sind, PostgreSQL aus dem Quellcode zu kompilieren.

Es gibt eine Erklärung in src/backend/snowball/README :

Jetzt gibt es hier einen tschechischen Snowball-Stemmer , es wurde in das Projekt eingebracht. Es gibt kein Wörterbuch für Stoppwörter, aber ich bin sicher, dass Sie entweder eines finden oder selbst eines erstellen können.

Die eigentliche Arbeit wäre, Snowball zu installieren und den Snowball-to-C-Compiler zu verwenden, um die C- und Header-Dateien zu erstellen, die der PostgreSQL-Quelle hinzugefügt werden sollen. Diese Dateien sollten dann stabil bleiben, sodass es nicht schwierig sein sollte, auf eine neue zu aktualisieren PostgreSQL-Version.

Wenn Sie bereit sind, die Arbeit zu erledigen, aber PostgreSQL nicht jedes Mal patchen und aus dem Quellcode erstellen möchten, können Sie auch in Betracht ziehen, einen Patch an PostgreSQL zu senden. Solange der Stemmer gut funktioniert, erwarte ich nicht, dass Sie dort viel Widerstand finden werden (aber der Patch-Übermittlungsprozess ist immer noch langwierig).