PostgreSQL
 sql >> Datenbank >  >> RDS >> PostgreSQL

to_sql + sqlalchemy + kopieren von + postgresql-Engine?

Das ist nicht ganz richtig. Sie können dies implementieren, um COPY FROM zu verwenden indem Sie Ihre eigene Funktion für die kwarg method bereitstellen das to_sql akzeptiert. Das Schlüsselbit in der Pandas-Dokumentation für DataFrame .to_sql ist wo method kann nicht nur ein String sein, sondern ein Callable. Das stellen Sie bereit

Zum Beispiel:

from csv import (writer as csv_writer, QUOTE_MINIMAL)
from io import StringIO

def some_function(df, connection):        
    try:
        frame.to_sql(
            'my_table',
            connection,
            schema='public',
            if_exists='append',
            index=False,
            method=copy_from_method)
    except Exception as err:
        print('Got an error ({})'.format(str(err))

Dann könnten Sie copy_from_method implementieren etwa so:

def copy_from_method(table, conn, keys, data_iter, pre_truncate=False, fatal_failure=False):
    "Custom method for pandas.DataFrame.to_sql that will use COPY FROM"""

    dbapi_conn = conn.connection
    cur = dbapi_conn.cursor()

    s_buf = StringIO()
    writer = csv_writer(s_buf, quoting=QUOTE_MINIMAL)
    writer.writerows(data_iter)
    s_buf.seek(0)

    columns = ', '.join('"{}"'.format(k) for k in keys)
    table_name = '{}.{}'.format(
        table.schema, table.name) if table.schema else table.name

    sql_query = 'COPY %s (%s) FROM STDIN WITH CSV' % (table_name, columns)
    cur.copy_expert(sql=sql_query, file=s_buf)
    return cur.rowcount

Das Beispiel copy_from_method könnte offensichtlich etwas Arbeit gebrauchen - und Sie müssen in einigen Fällen vorsichtig sein, wenn Sie den CSV-Writer zitieren und maskieren. Aber diese grobe Version sollte relativ gut funktionieren, abgesehen von Tippfehlern/Copy-Paste-Fehlern (dies ist eine abgespeckte Version, die ich in einem Projekt verwende)