Die Abfrage zum Zählen der "eindeutigen" Vorkommen innerhalb einer "EndpointId"
jeder der "Uid"
in "Tags"
und der "Type"
in "Sensors"
wäre:
db.collection.aggregate([
{ "$unwind": "$Tags" },
{ "$unwind": "$Tags.Sensors" },
{ "$group": {
"_id": {
"EndpointId": "$EndpointId",
"Uid": "$Tags.Uid",
"Type": "$Tags.Sensors.Type"
},
}},
{ "$group": {
"_id": {
"EndpointId": "$_id.EndpointId",
"Uid": "$_id.Uid",
},
"count": { "$sum": 1 }
}},
{ "$group": {
"_id": "$_id.EndpointId",
"tagCount": { "$sum": 1 },
"sensorCount": { "$sum": "$count" }
}}
])
Oder für C#
var results = collection.AsQueryable()
.SelectMany(p => p.Tags, (p, tag) => new
{
EndpointId = p.EndpointId,
Uid = tag.Uid,
Sensors = tag.Sensors
}
)
.SelectMany(p => p.Sensors, (p, sensor) => new
{
EndpointId = p.EndpointId,
Uid = p.Uid,
Type = sensor.Type
}
)
.GroupBy(p => new { EndpointId = p.EndpointId, Uid = p.Uid, Type = p.Type })
.GroupBy(p => new { EndpointId = p.Key.EndpointId, Uid = p.Key.Uid },
(k, s) => new { Key = k, count = s.Count() }
)
.GroupBy(p => p.Key.EndpointId,
(k, s) => new
{
EndpointId = k,
tagCount = s.Count(),
sensorCount = s.Sum(x => x.count)
}
);
Welche Ausgaben:
{
"EndpointId" : "89799bcc-e86f-4c8a-b340-8b5ed53caf83",
"tagCount" : 4,
"sensorCount" : 16
}
Obwohl dies eigentlich der "effizienteste" Weg ist, wenn man bedenkt, dass die präsentierten Dokumente eindeutige Werte für "Uid"
haben sowieso wäre $reduce
die Beträge in den Dokumenten selbst:
db.collection.aggregate([
{ "$group": {
"_id": "$EndpointId",
"tags": {
"$sum": {
"$size": { "$setUnion": ["$Tags.Uid",[]] }
}
},
"sensors": {
"$sum": {
"$sum": {
"$map": {
"input": { "$setUnion": ["$Tags.Uid",[]] },
"as": "tag",
"in": {
"$size": {
"$reduce": {
"input": {
"$filter": {
"input": {
"$map": {
"input": "$Tags",
"in": {
"Uid": "$$this.Uid",
"Type": "$$this.Sensors.Type"
}
}
},
"cond": { "$eq": [ "$$this.Uid", "$$tag" ] }
}
},
"initialValue": [],
"in": { "$setUnion": [ "$$value", "$$this.Type" ] }
}
}
}
}
}
}
}
}}
])
Die Anweisung lässt sich jedoch nicht gut auf LINQ abbilden, sodass Sie das BsonDocument
verwenden müssten -Schnittstelle zum Erstellen des BSON für die Anweisung. Und natürlich wo die gleiche "Uid"
Werte, die tatsächlich in mehreren Dokumenten in der Sammlung "taten", dann $unwind
-Anweisungen sind notwendig, um diese innerhalb der Array-Einträge dokumentenübergreifend zu "gruppieren".
Original
Sie lösen dies, indem Sie den $size
abrufen
der Arrays. Für das äußere Array gilt dies einfach für den Feldpfad des Arrays im Dokument, und für die inneren Array-Elemente müssen Sie mit $map
um jeden "Tags"
zu verarbeiten -Element und rufen Sie dann $size
ab
von "Sensors"
und $sum
das resultierende Array auf die Gesamtzahl zu reduzieren.
Pro Dokument wäre das:
db.collection.aggregate([
{ "$project": {
"tags": { "$size": "$Tags" },
"sensors": {
"$sum": {
"$map": {
"input": "$Tags",
"in": { "$size": "$$this.Sensors" }
}
}
}
}}
])
Wo Sie Klassen in Ihrem C#-Code zugewiesen haben, wäre wie folgt:
collection.AsQueryable()
.Select(p => new
{
tags = p.Tags.Count(),
sensors = p.Tags.Select(x => x.Sensors.Count()).Sum()
}
);
Wo diese zurückkehren:
{ "tags" : 3, "sensors" : 13 }
{ "tags" : 2, "sensors" : 8 }
Wo Sie $group
möchten
die Ergebnisse, wie zum Beispiel über die gesamte Sammlung, dann würden Sie tun:
db.collection.aggregate([
/* The shell would use $match for "query" conditions */
//{ "$match": { "EndpointId": "89799bcc-e86f-4c8a-b340-8b5ed53caf83" } },
{ "$group": {
"_id": null,
"tags": { "$sum": { "$size": "$Tags" } },
"sensors": {
"$sum": {
"$sum": {
"$map": {
"input": "$Tags",
"in": { "$size": "$$this.Sensors" }
}
}
}
}
}}
])
Was für Ihren C#-Code wie zuvor wäre:
collection.AsQueryable()
.GroupBy(p => "", (k,s) => new
{
tags = s.Sum(p => p.Tags.Count()),
sensors = s.Sum(p => p.Tags.Select(x => x.Sensors.Count()).Sum())
}
);
Wo diese zurückkehren:
{ "tags" : 5, "sensors" : 21 }
Und für "EndpointId
, dann verwenden Sie einfach dieses Feld als Gruppierungsschlüssel und nicht null
oder 0
wie es von der C#-Treiberzuordnung angewendet wird:
collection.AsQueryable()
/* Use the Where if you want a query to match only those documents */
//.Where(p => p.EndpointId == "89799bcc-e86f-4c8a-b340-8b5ed53caf83")
.GroupBy(p => p.EndpointId, (k,s) => new
{
tags = s.Sum(p => p.Tags.Count()),
sensors = s.Sum(p => p.Tags.Select(x => x.Sensors.Count()).Sum())
}
);
Das ist natürlich die gleiche Summe der beiden Dokumentenmuster, die Sie uns gegeben haben:
{ "tags" : 5, "sensors" : 21 }
Das sind also sehr einfache Ergebnisse mit einfacher Pipeline-Ausführung, sobald Sie sich an die Syntax gewöhnt haben.
Ich schlage vor, sich mit den Aggregationsoperatoren vertraut zu machen aus der Kerndokumentation und natürlich dem "LINQ-Spickzettel" von Ausdrücken und deren Verwendungszuordnung aus dem C#-Treibercode-Repository.
Siehe auch die allgemeine LINQ-Referenz in der C#-Treiberreferenz für weitere Beispiele, wie dies allgemein auf das Aggregation Framework von MongoDB abgebildet wird.