Database
 sql >> Datenbank >  >> RDS >> Database

Arbeiten mit Nicht-ASCII-JDBC-Daten in Talend

Beim Testen von Talend mit der Easysoft JDBC-ODBC Bridge ist beim Schreiben von Nicht-ASCII-Daten aus einer SQL Server-Datenbank in eine Datei im CSV-Format eine Textbeschädigung aufgetreten.

Die Problemumgehung bestand darin, den Datentyp für die Problemspalte im Talend-Schema von einem String zu ändern zu einem byte[] . Dazu gehen wir wie folgt vor:

  1. Auf die Eigenschaften der tJDBCInput-Komponente zugegriffen.
  2. Wählen Sie die Schaltfläche "Schema bearbeiten".
  3. Datentypdefinition für die relevante Spalte geändert.

Die Standardzeichenkodierung von Talend ist UTF-8. Solange Daten, die von einem JDBC-Treiber zurückgegeben werden, ASCII sind, sind Daten, die mit einer anderen Zeichencodierung codiert sind, kein Problem:UTF-8-Daten, die nur ASCII-Zeichen enthalten, sind identisch mit Daten.