Mysql
 sql >> Datenbank >  >> RDS >> Mysql

MySQL:SUM() mit JOIN gibt falsche Werte zurück

Probieren Sie diese Abfrage aus:

SELECT bl.user_id, SUM( ph.amount ) PAIDOUT
FROM (
   SELECT distinct blocks.user_id 
   FROM blocks
   WHERE confirms > 520
) bl
LEFT JOIN  payout_history ph
ON bl.user_id = ph.user_id
GROUP BY ph.user_id
;

SQLFiddle --> http://sqlfiddle.com/#!2/7b988/48



--- BEARBEITEN --- eine Erklärung, wie die Abfrage funktioniert (oder besser gesagt, warum Ihre Abfrage nicht funktioniert) ----

Betrachtet man die erwarteten Ergebnisse, so scheint es, dass die Abfrage eine Summe von amount berechnen sollte Spalte für jede user_id , aber nur für diese user_id , die ebenfalls in den blocks stehen Tabelle und haben eine blocks.confirms Wert größer als 520.
Ein einfacher Join (auch Left Outer Join) kann in diesem Fall nicht funktionieren, da der blocks Die Tabelle kann viele Datensätze für dieselbe user_id enthalten , zum Beispiel eine Abfrage, die nur Zeilen für user_id=110 zurückgibt ergibt folgende Ergebnisse:

SELECT *
FROM blocks
WHERE confirms > 520
      AND user_id = 110;

+ ------- + ------------ + ----------- + ------------- +
| id      | user_id      | reward      | confirms      |
+ ------- + ------------ + ----------- + ------------- +
| 0       | 110          | 20.89832115 | 521           |
| 65174   | 110          | 3.80357075  | 698           |
| 65204   | 110          | 4.41933060  | 668           |
| 65218   | 110          | 4.69059801  | 654           |
| 65219   | 110          | 4.70222521  | 653           |
| 65230   | 110          | 4.82805490  | 642           |
| 65265   | 110          | 5.25058079  | 607           |
| 65316   | 110          | 6.17262650  | 556           |
+ ------- + ------------ + ----------- + ------------- +

Der gerade Join (und der linke/rechte äußere Join) funktioniert so, dass jeder Datensatz aus der ersten verbundenen Tabelle genommen und dieser Datensatz mit allen Zeilen aus der anderen verbundenen Tabelle gepaart (kombiniert) wird, die die Join-Bedingung erfüllen.

In unserem Fall erzeugt der linke Join folgende Ergebnismenge:

SELECT *
FROM blocks
LEFT JOIN payout_history
ON blocks.user_id = payout_history.user_id
WHERE confirms > 520
    AND blocks.user_id = 110;
+ ------- + ------- + ----------- + -------- + --- + ------- + ----------- +
| id      | user_id | reward      | confirms | id  | user_id | amount      |
+ ------- + ------- + ----------- + -------- + --- + ------- + ----------- +
| 0       | 110     | 20.89832115 | 521      | 1   | 110     | 20.898319   |
| 65174   | 110     | 3.80357075  | 698      | 1   | 110     | 20.898319   |
| 65204   | 110     | 4.41933060  | 668      | 1   | 110     | 20.898319   |
| 65218   | 110     | 4.69059801  | 654      | 1   | 110     | 20.898319   |
| 65219   | 110     | 4.70222521  | 653      | 1   | 110     | 20.898319   |
| 65230   | 110     | 4.82805490  | 642      | 1   | 110     | 20.898319   |
| 65265   | 110     | 5.25058079  | 607      | 1   | 110     | 20.898319   |
| 65316   | 110     | 6.17262650  | 556      | 1   | 110     | 20.898319   |
+ ------- + ------- + ----------- + -------- + --- + ------- + ----------- +

und jetzt, wenn wir SUM( amount ) .... GROUP BY user_id , berechnet MySql eine Summe aller amount Werte aus der obigen Ergebnismenge ( 8 Zeilen * 20,898 =~ 167,184 )

SELECT blocks.user_id, sum( amount)
FROM blocks
LEFT JOIN payout_history
ON blocks.user_id = payout_history.user_id
WHERE confirms > 520
    AND blocks.user_id = 110
GROUP BY blocks.user_id;
+ ------------ + ----------------- +
| user_id      | sum( amount)      |
+ ------------ + ----------------- +
| 110          | 167.186554        |
+ ------------ + ----------------- +



Wie Sie in diesem Fall sehen, liefert uns der Join nicht die gewünschten Ergebnisse - wir brauchen etwas namens a semi join - Unten sind verschiedene Varianten von Semi-Joins, probieren Sie sie aus:

SELECT bl.user_id, SUM( ph.amount ) PAIDOUT
FROM (
   SELECT distinct blocks.user_id 
   FROM blocks
   WHERE confirms > 520
) bl
LEFT JOIN  payout_history ph
ON bl.user_id = ph.user_id
GROUP BY ph.user_id
;


SELECT ph.user_id, SUM( ph.amount ) PAIDOUT
FROM payout_history ph
WHERE ph.user_id IN (
     SELECT user_id FROM blocks
     WHERE confirms > 520
  )
GROUP BY ph.user_id
;

SELECT ph.user_id, SUM( ph.amount ) PAIDOUT
FROM payout_history ph
WHERE EXISTS (
     SELECT 1 FROM blocks bl
     WHERE bl.user_id = ph.user_id
        AND bl.confirms > 520
  )
GROUP BY ph.user_id
;