Mysql
 sql >> Datenbank >  >> RDS >> Mysql

Text in bengalischer Sprache wird in der Unicode-CSV-Datei nicht angezeigt

Gemäß den Antworten auf die Frage Excel zu CSV mit UTF8-Codierung , Google Docs sollte CSV korrekt speichern, im Gegensatz zu Excel, das alle Zeichen zerstört, die in der verwendeten „ANSI“-Codierung nicht darstellbar sind. Aber vielleicht haben sie das geändert oder etwas falsch gemacht, oder die Analyse der Situation ist falsch.

Für richtig codiertes Bangla (Bengalisch), das in MS Office-Programmen verarbeitet wird, sollten keine „Bangla-Schriftarten“ benötigt werden, da die Schriftart Arial Unicode MS (im Lieferumfang von Office enthalten) die Bangla-Zeichen enthält. Sind die Daten also tatsächlich in einer nicht standardmäßigen Codierung, die auf einer speziell codierten Schriftart beruht? In diesem Fall sollte es zuerst in Unicode konvertiert werden, obwohl es möglicherweise irgendwie mit Programmen verwaltet werden kann, die diese bestimmte Schriftart konsequent verwenden.

In Excel können Sie bei Verwendung von Speichern unter „Unicode-Text (*.txt)“ auswählen. Es speichert die Daten als TSV (tabulatorgetrennte Werte) in UTF-16-Codierung. Möglicherweise müssen Sie es dann konvertieren, um Kommas als Trennzeichen anstelle von Tabulatoren zu verwenden, und/oder von UTF-16 in UTF-8. Dies funktioniert jedoch nur, wenn die Originaldaten richtig codiert sind.