Die kurze Antwort lautet:Sie können nicht, nicht nur basierend auf dem Durchschnitt. Dokumentengröße (zumindest nicht genau).
Um es ausführlicher zu erklären:
Der benötigte Speicherplatz auf der Festplatte ist nicht einfach eine Funktion der durchschnittlichen Dokumentgröße. Es gibt auch den Platz, der für alle von Ihnen erstellten Indizes benötigt wird. Dann gibt es den Platz, der benötigt wird, wenn Sie diese Bewegungen auslösen (trotz Auffüllen passiert dies) - dieser Platz wird auf einer Liste platziert, um wiederverwendet zu werden, aber abhängig von den Daten, die Sie anschließend einfügen, kann dies möglich sein oder nicht diesen Platz wiederverwenden.
Sie können auch hinzufügen, dass die Vorabzuweisung bedeutet, dass gelegentlich eine Handvoll Dokumente Ihre Speicherplatznutzung um ~2 GB erhöht, wenn eine neue Datendatei zugewiesen wird. Natürlich handelt es sich bei ausreichenden Daten im Wesentlichen um einen Rundungsfehler, aber es lohnt sich, dies zu berücksichtigen.
Die einzige Möglichkeit, diese Art von Daten-Größen-Verhältnis unter der Annahme eines konsistenten Nutzungsmusters abzuschätzen, besteht darin, es im Laufe der Zeit für Ihren speziellen Anwendungsfall zu verfolgen und die Speicherplatznutzung im Vergleich zu den eingefügten Daten zu verfolgen (die Anzahl der Dokumente ist möglicherweise besser als das Datenvolumen abhängig von der Variabilität der Dokumentgröße).
Ähnlich verhält es sich, wenn Sie die Einfügungsrate, die Dokumentgröße und den durch eine Neusynchronisierung/Reparatur zurückgewonnenen Speicherplatz verfolgen. FYI - Sie können eine sekundäre Datei von Grund auf neu synchronisieren, um eine "frische" Kopie der Datendateien zu erhalten, anstatt eine Reparatur durchzuführen, die weniger störend sein kann und je nach Konfiguration weniger Speicherplatz benötigt.