PostgreSQL
 sql >> Datenbank >  >> RDS >> PostgreSQL

Optimaler Chunksize-Parameter in pandas.DataFrame.to_sql

In meinem Fall wurden 3 Millionen Zeilen mit 5 Spalten in 8 Minuten eingefügt, als ich pandas to_sql verwendete Funktionsparameter als chunksize=5000 und method='multi'. Dies war eine enorme Verbesserung, da das Einfügen von 3 Millionen Zeilen mit Python in die Datenbank sehr schwierig für mich wurde.