Beim Testen von Talend mit der Easysoft JDBC-ODBC Bridge ist beim Schreiben von Nicht-ASCII-Daten aus einer SQL Server-Datenbank in eine Datei im CSV-Format eine Textbeschädigung aufgetreten.
Die Problemumgehung bestand darin, den Datentyp für die Problemspalte im Talend-Schema von einem String
zu ändern zu einem byte[]
. Dazu gehen wir wie folgt vor:
- Auf die Eigenschaften der tJDBCInput-Komponente zugegriffen.
- Wählen Sie die Schaltfläche "Schema bearbeiten".
- Datentypdefinition für die relevante Spalte geändert.
Die Standardzeichenkodierung von Talend ist UTF-8. Solange Daten, die von einem JDBC-Treiber zurückgegeben werden, ASCII sind, sind Daten, die mit einer anderen Zeichencodierung codiert sind, kein Problem:UTF-8-Daten, die nur ASCII-Zeichen enthalten, sind identisch mit Daten.