"Gruppieren nach" und "dumm schnell" passen nicht zusammen. Das ist einfach die Natur dieses Biests ... Daher die Einschränkungen für Mongos Gruppenoperationen; Cassandra unterstützt es nicht einmal nativ (obwohl es für Hive- oder Pig-Abfragen über Hadoop funktioniert ... aber diese sollen nicht dumm schnell sein).
Systeme wie Twitters Rainbird (das Cassandra verwendet), die Echtzeitanalysen durchführen, tun dies, indem sie die Zählungen denormalisieren/vorberechnen:http://www.slideshare.net/kevinweil/rainbird-realtime-analytics-at-twitter-strata-2011