PostgreSQL
 sql >> Datenbank >  >> RDS >> PostgreSQL

Optimieren Sie die Abfrage in PostgreSQL

Neuformatierung Ihres Abfrageplans zur Verdeutlichung:

QUERY PLAN Aggregate (cost=126377.96..126377.97 rows=1 width=0)
  -> Hash Join (cost=6014.51..126225.38 rows=61033 width=0)
     Hash Cond: (contacts_lists.contact_id = plain_contacts.contact_id)
    -> Hash Join (cost=3067.30..121828.63 rows=61033 width=8)
       Hash Cond: (contacts_lists.contact_id = contacts.id)
      -> Index Scan using index_contacts_lists_on_list_id_and_contact_id
         on contacts_lists (cost=0.00..116909.97 rows=61033 width=4)
         Index Cond: (list_id = 66996)
         -> Hash (cost=1721.41..1721.41 rows=84551 width=4)
         -> Seq Scan on contacts (cost=0.00..1721.41 rows=84551 width=4)
            Filter: ((NOT email_bad) AND (NOT email_unsub))
            -> Hash (cost=2474.97..2474.97 rows=37779 width=4)
            -> Seq Scan on plain_contacts (cost=0.00..2474.97 rows=37779 width=4)
               Filter: has_email

Zwei Teilindizes vielleicht Seq-Scans je nach Datenverteilung eliminieren:

-- if many contacts have bad emails or are unsubscribed:
CREATE INDEX contacts_valid_email_idx ON contacts (id)
WHERE (NOT email_bad AND NOT email_unsub);

-- if many contacts have no email:
CREATE INDEX plain_contacts_valid_email_idx ON plain_contacts (id)
WHERE (has_email);

Möglicherweise fehlt ein Index für einen Fremdschlüssel:

CREATE INDEX plain_contacts_contact_id_idx ON plain_contacts (contact_id);

Zu guter Letzt, wenn Sie Ihre Daten noch nie analysiert haben, müssen Sie Folgendes ausführen:

VACUUM ANALYZE;

Wenn es nach all dem immer noch langsam ist, können Sie nicht viel tun, außer Ihre plain_contacts und Ihre Kontakttabellen zusammenzuführen:Wenn Sie den obigen Abfrageplan trotz der obigen Indizes erhalten, bedeutet dies, dass die meisten / alle Ihrer Abonnenten diesen abonniert haben bestimmte Liste -- in diesem Fall erhalten Sie den obigen Abfrageplan am schnellsten.