PostgreSQL
 sql >> Datenbank >  >> RDS >> PostgreSQL

Stammnamen von Eigennamen in PostgreSQL verhindern?

Der Sinn von Stemming-Algorithmen ist nicht jedes Wort auf seinen richtigen Stamm zu reduzieren; Ziel ist es, Wörter, die sich ähnlich sind, auf eine gemeinsame Stammform zu reduzieren. Das Ziel ist im Allgemeinen nicht, ein Wort zu erhalten, das dem Benutzer präsentiert werden kann:Selbst wenn „balling“ und „ball“ beide „kjebnkkekaa“ erzeugen würden, ist der Algorithmus korrekt, da er „balling“ und „ball“ immer noch als allgemein besorgniserregend ansieht dasselbe.

Beachten Sie auch, dass kein Stemming-Algorithmus absolut perfekt ist. Weitere Informationen finden Sie unter Porter Stemming-Algorithmus