Mysql
 sql >> Datenbank >  >> RDS >> Mysql

Ruby CSV liest mehrzeilige Felder

Ihr Problem ist nicht die mehrzeilige, sondern eine fehlerhafte CSV.

Ersetzen Sie \" und ein Leerzeichen nach einem Zeilenende wie folgt:

require 'csv' 

ml = %q{"id","name","address","email","potato" 
1,"Bob","---  
- 101 Cottage row 
- Lovely Village 
- \"\" 
","[email protected]","omnomnom" 
2,"Charlie","---  
- 102 Flame Street 
- \"\" 
- \"\" 
","[email protected]","andcheese" 
4,"Doug","---  
- 103 Dark Cave 
- Next to some geo dude 
- So many bats 
","[email protected]","usemeltattack"}

ml.gsub!(/\" \n/,"\"\n").gsub!(/\\\"/,"__")

CSV.parse(ml, {:headers=>true}) do |row|
  puts row
end

Das ergibt:

"id","name","address","email","potato"
1,"Bob","---  
- 101 Cottage row 
- Lovely Village 
- ____
","[email protected]","omnomnom"
etc

Wenn Sie keine Kontrolle über das Programm haben, das die CSV-Datei liefert, müssen Sie die Datei öffnen, den Inhalt lesen, eine Ersetzung durchführen und dann die CSV-Datei parsen. Ich verwende __ hier, aber Sie können andere nicht widersprüchliche Zeichen verwenden.