Die Idee ist, dass Sie die Leistung von Aggregationsabfragen verbessern, indem Sie MapReduce auf einer fragmentierten Datenbank verwenden, die auf mehrere Computer verteilt ist.
Ich habe einige Vergleiche der Leistung von Mongos Mapreduce mit einer Group-by-Select-Anweisung in Oracle auf derselben Maschine durchgeführt. Ich fand heraus, dass Mongo ungefähr 25-mal langsamer war. Das bedeutet, dass ich die Daten über mindestens 25 Maschinen verteilen muss, um mit Mongo die gleiche Leistung zu erzielen, die Oracle auf einer einzelnen Maschine liefert. Ich habe eine Sammlung/Tabelle mit ungefähr 14 Millionen Dokumenten/Zeilen verwendet.
Das Exportieren der Daten aus Mongo über mongoexport.exe und das Verwenden der exportierten Daten als externe Tabelle in Oracle und das Durchführen eines Group-By in Oracle war viel schneller als die Verwendung von Mongos eigenem MapReduce.