Der mongoimport
Werkzeug hat eine Option:
--jsonArray
Eingabequelle als JSON-Array behandeln
Oder es ist möglich, aus einer Datei zu importieren, die dasselbe Datenformat wie das Ergebnis von db.collection.find()
enthält Befehl. Hier ist ein Beispiel der Kursunterlagen von university.mongodb.com, einige Inhalte aus grades.json
:
{ "_id" : { "$oid" : "50906d7fa3c412bb040eb577" }, "student_id" : 0, "type" : "exam", "score" : 54.6535436362647 }
{ "_id" : { "$oid" : "50906d7fa3c412bb040eb578" }, "student_id" : 0, "type" : "quiz", "score" : 31.95004496742112 }
{ "_id" : { "$oid" : "50906d7fa3c412bb040eb579" }, "student_id" : 0, "type" : "homework", "score" : 14.8504576811645 }
Wie Sie sehen können, wird kein Array verwendet und auch keine Kommatrennzeichen zwischen Dokumenten.
Ich habe kürzlich entdeckt, dass dies dem the JSON Lines text
entspricht formatieren.
Wie in apache.spark.sql.DataFrameReader.json()
verwendet Methode.