Mysql
 sql >> Datenbank >  >> RDS >> Mysql

Bigquery:Mehrere Tabellen durchsuchen und mit first_seen und last_seen aggregieren

Ich würde zuerst die Tabellen vereinigen (in BigQuery ist die Syntax für die Vereinigung Komma). Dann gibt es zwei Ansätze:

  1. Verwenden Sie die Analysefunktionen FIRST_VALUE und LAST_VALUE.
SELECT id, timestamp_first, timestamp_last, data FROM
(SELECT 
  id,
  timestamp,
  FIRST_VALUE(timestamp) OVER(
    PARTITION BY id
    ORDER BY timestamp ASC
    ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING)
  AS timestamp_first,
  LAST_VALUE(timestamp) OVER(
    PARTITION BY id
    ORDER BY timestamp ASC
    ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING)
  AS timestamp_last
FROM table1, table2, table3
  1. Verwenden Sie die Aggregation MIN/MAX für den Zeitstempel, um den ersten/letzten zu finden, und verbinden Sie ihn dann wieder mit denselben Tabellen.
SELECT a.id id, timestamp_first, timestamp_last, data FROM
(SELECT id, data FROM table1,table2,table3) a
INNER JOIN
(SELECT 
   id, 
   MIN(timestamp) timestamp_first,
   MAX(timestamp) timestamp_last 
 FROM table1,table2,table3 GROUP BY id) b
ON a.id = b.id