Ich verwende einen ähnlichen Ansatz mit sortierten Sätzen, um die Volltextindizierung zu implementieren. Der Gesamtansatz ist gut, obwohl es ein paar ziemlich einfache Verbesserungen gibt, die Sie vornehmen könnten.
- Anstatt zufällig generierte Schlüssel zu verwenden, können Sie die Abfrage (oder eine Kurzform davon) als Schlüssel verwenden. Dadurch können Sie die bereits berechneten Sätze wiederverwenden, was die Leistung erheblich verbessern könnte, wenn Sie Abfragen über zwei große Sätze haben, die häufig auf ähnliche Weise kombiniert werden.
- Die Behandlung des Titels als vollständige Zeichenfolge führt zu einer sehr großen Anzahl von Einzelelementsätzen. Es kann besser sein, einzelne Wörter im Titel zu indizieren und die Endergebnisse für eine genaue Übereinstimmung zu filtern, wenn Sie es wirklich brauchen.