PostgreSQL
 sql >> Datenbank >  >> RDS >> PostgreSQL

Erhalten Sie unterschiedliche aufeinanderfolgende Datumsbereiche aus sich überschneidenden Datumsbereichen

Die Logik ist:

  • am Anfang eines Intervalls seinen Wert zu einer kumulativen Summe addieren
  • am Ende eines Intervalls seinen Wert von dieser Summe subtrahieren
  • aber um zu fegen die Datumsgrenze, müssen wir alle (eindeutigen) Datums-/Zeitstempel sammeln, entweder Start oder Stopp.

Der Punkt ist also:Konvertieren Sie die Daten aus einer Reihe von Intervallen zu einer Reihe von (Start/Stopp) Ereignissen , und über diese aggregieren.

-- \i tmp.sql

create table coinsonperiod(
  id serial,
  startdate date,
  enddate date,
  coins integer
);
insert into coinsonperiod (startdate, enddate, coins) values
  ('2018-01-01','2018-01-31', 80)
, ('2018-01-07','2018-01-10', 10)
, ('2018-01-07','2018-01-31', 10)
, ('2018-01-11','2018-01-31', 5)
, ('2018-01-25','2018-01-27', 5)
, ('2018-02-02','2018-02-23', 100)
        ;

WITH changes AS (
    SELECT startdate AS tickdate , coins
            , 1 AS cover
    FROM coinsonperiod
    UNION ALL
    -- add 1 day to convert to half-open intervals
    SELECT 1+enddate AS tickdate, -1* coins
            , -1 AS cover
    FROM coinsonperiod
    )
, sumchanges  AS (
        SELECT tickdate, SUM(coins) AS change, SUM(cover) AS cover
        FROM changes
        GROUP BY tickdate
        )
, aggregated AS (
        SELECT
        tickdate AS startdate
        , lead(tickdate) over www AS enddate
        , sum(change) OVER www AS cash
          -- number of covered intervals
        , sum(cover) OVER www AS cover
        FROM sumchanges
        WINDOW www AS (ORDER BY tickdate)
        )
             -- substract one day from enddate to correct back to closed intervals
SELECT startdate, enddate-1 AS enddate, cash, cover
FROM aggregated
WHERE cover > 0
ORDER BY startdate
        ;