Betrachten Sie die Erweiterung pg_trgm
statt levenshtein()
. Es ist um Größenordnungen schneller, wenn es mit einem GiST-Index unterstützt wird, um den KNN-Funktion in PostgreSQL 9.1 oder höher
.
Installieren Sie die Erweiterung einmal pro Datenbank:
CREATE EXTENSION pg_trgm;
Und verwenden Sie den <->
oder %
Betreiber
. Mehrere verwandte Antworten wurden hier auf SO gepostet, suchen Sie nach pg_tgrm [PostgreSQL] ...
Wilder Schuss auf das, was Sie wollen:
WITH x AS (
SELECT unnest(string_to_array(trim(strip(
'fat:2,4 cat:3 rat:5A'::tsvector)::text, ''''), ''' ''')) AS val
) -- provide ts_vector, extract strings
, y AS( SELECT 'brat'::text AS term) -- provide term to match
SELECT val, term
,(val <-> term) AS trg_dist -- distance operator
,levenshtein(val, term) AS lev_dist
FROM x, y;
Rückgabe:
val | term | trg_dist | lev_dist
-----+------+----------+----------
cat | brat | 0.875 | 2
fat | brat | 0.875 | 2
rat | brat | 0.714286 | 1