PostgreSQL
 sql >> Datenbank >  >> RDS >> PostgreSQL

Aggregieren Sie Funktionen über Arrays

Probieren Sie so etwas aus:

SELECT id, unnest(array300) as val, ntile(100) OVER (PARTITION BY id) as bucket_num
FROM your_table

Dieses SELECT gibt Ihnen 300 Datensätze pro array300 mit derselben id und ihnen die bucket_num zuweisen (1 für die ersten 3 Elemente, 2 für die nächsten 3 usw.).

Verwenden Sie dann diese Auswahl, um den avg zu erhalten der Elemente im Bucket:

SELECT id, avg(val) as avg_val
FROM (...previous select here...)
GROUP BY id, bucket_num

Als nächstes aggregieren Sie einfach den avg_val in das Array:

SELECT id, array_agg(avg_val) as array100
FROM (...previous select here...)
GROUP BY id

Details:entschachteln , ntil , array_agg , OVER (PARTITION BY )

UPD:Versuchen Sie diese Funktion:

CREATE OR REPLACE FUNCTION public.array300_to_100 (
  p_array300 numeric []
)
RETURNS numeric [] AS
$body$
DECLARE
  dim_start int = array_length(p_array300, 1); --size of input array
  dim_end int = 100; -- size of output array
  dim_step int = dim_start / dim_end; --avg batch size
  tmp_sum NUMERIC; --sum of the batch
  result_array NUMERIC[100]; -- resulting array
BEGIN

  FOR i IN 1..dim_end LOOP --from 1 to 100.
    tmp_sum = 0;

    FOR j IN (1+(i-1)*dim_step)..i*dim_step LOOP --from 1 to 3, 4 to 6, ...
      tmp_sum = tmp_sum + p_array300[j];  
    END LOOP; 

    result_array[i] = tmp_sum / dim_step;
  END LOOP; 

  RETURN result_array;
END;
$body$
LANGUAGE 'plpgsql'
IMMUTABLE
RETURNS NULL ON NULL INPUT;

Es braucht ein array300 und gibt ein array100 aus . So verwenden Sie es:

SELECT id, array300_to_100(array300)
FROM table1;

Bei Verständnisproblemen einfach fragen.