MongoDB
 sql >> Datenbank >  >> NoSQL >> MongoDB

Welche Datenbank ist zu wählen (Cassandra, MongoDB, ?) zum Speichern und Abfragen von Ereignis-/Protokoll-/Metrikdaten?

"Gruppieren nach" und "dumm schnell" passen nicht zusammen. Das ist einfach die Natur dieses Biests ... Daher die Einschränkungen für Mongos Gruppenoperationen; Cassandra unterstützt es nicht einmal nativ (obwohl es für Hive- oder Pig-Abfragen über Hadoop funktioniert ... aber diese sollen nicht dumm schnell sein).

Systeme wie Twitters Rainbird (das Cassandra verwendet), die Echtzeitanalysen durchführen, tun dies, indem sie die Zählungen denormalisieren/vorberechnen:http://www.slideshare.net/kevinweil/rainbird-realtime-analytics-at-twitter-strata-2011