PostgreSQL
 sql >> Datenbank >  >> RDS >> PostgreSQL

Doppelte Einfügungen ohne eindeutige Einschränkung in der Zieltabelle vermeiden?

Die CDC-Komponenten in der kostenpflichtigen Version von Talend Studio for Data Integration adressieren dies zweifellos.

In Open Studio können Sie Ihre eigene Änderungsdatenerfassung basierend auf dem zusammengesetzten, eindeutigen Schlüssel (Vorname, Nachname, Geburtsdatum, Geschlecht) durchführen.

  • Verwenden Sie tUniqueRow für Daten aus stage_geno_patients, eindeutig in den folgenden Spalten:Vorname, Nachname, Geburtsdatum, Geschlecht
  • Füttere das in eine tMap ein
  • Fügen Sie eine weitere Abfrage als Eingabe zur tMap hinzu, um Nachschlagevorgänge in der Tabelle hinter "patients_test" durchzuführen, um eine Übereinstimmung für Vorname, Nachname, Geburtsdatum, Geschlecht zu finden. Diese Suche sollte „für jede Zeile neu laden“, indem sie mit Werten aus der Staging-Zeile nachschlägt
  • Erkennen Sie im Falle einer Nichtübereinstimmung diese und fügen Sie dann die Staging-Datenzeile in die Tabelle hinter "patients_test" ein

F:Werden Sie auch Informationen aktualisieren? Oder besteht das Ziel nur darin, eindeutige Einfügungen vorzunehmen, wenn die Daten noch nicht vorhanden sind?