PostgreSQL
 sql >> Datenbank >  >> RDS >> PostgreSQL

Datensätze löschen, deren Nummer sich mehr als 5 wiederholt

OK, also kann die Logik hier zusammengefasst werden als:

  • Finde die längste Reihe derselben fortlaufenden Ziffer in einer gegebenen Zahl; und
  • Gib wahr zurück, wenn dieser längste Wert> 5 Ziffern ist

Richtig?

Teilen wir es also in eine Reihe aufeinanderfolgender Ziffern auf:

regress=> SELECT regexp_matches('666666689', '(0+|1+|2+|3+|4+|5+|6+|7+|8+|9+)', 'g');
 regexp_matches 
----------------
 {6666666}
 {8}
 {9}
(3 rows)

filtern Sie dann nach dem längsten:

regress=> 

SELECT x[1] 
FROM regexp_matches('6666666898', '(0+|1+|2+|3+|4+|5+|6+|7+|8+|9+)', 'g') x 
ORDER BY length(x[1]) DESC 
LIMIT 1;

    x    
---------
 6666666
(1 row)

... aber eigentlich ist uns das egal, nur wenn irgendein Eintrag länger als 5 Ziffern ist, also:

SELECT x[1] 
FROM regexp_matches('6666666898', '(0+|1+|2+|3+|4+|5+|6+|7+|8+|9+)', 'g') x 
WHERE length(x[1]) > 5;

kann als EXISTS verwendet werden testen, z. B.

WITH blah(n) AS (VALUES('999999969'),('000000089'),('666666689'),('15552555'))
SELECT n
FROM blah
WHERE EXISTS (
    SELECT x[1] 
    FROM regexp_matches(n, '(0+|1+|2+|3+|4+|5+|6+|7+|8+|9+)', 'g') x 
    WHERE length(x[1]) > 5
)

was eigentlich ziemlich effizient ist und das richtige Ergebnis zurückgibt (immer schön). Aber es kann noch etwas vereinfacht werden mit:

WITH blah(n) AS (VALUES('999999969'),('000000089'),('666666689'),('15552555'))
SELECT n
FROM blah
WHERE EXISTS (
    SELECT x[1] 
    FROM regexp_matches(n, '(0{6}|1{6}|2{6}|3{6}|4{6}|5{6}|6{6}|7{6}|8{6}|9{6})', 'g') x;
)

Sie können dasselbe WHERE verwenden -Klausel in einem DELETE .