Mysql
 sql >> Datenbank >  >> RDS >> Mysql

PHP-Wortindex, Leistung und vernünftige Ergebnisse

Besorgen Sie sich hier eine Liste mit Stoppwörtern (Nicht-Schlüsselwörtern), der Typ hat sie sogar in PHP für Sie formatiert /14/list-of-english-stop-words/">http://armandbrahaj.blog.al/2009/04/14/list-of-english-stop-words/

Dann führen Sie einfach ein preg_replace auf dem String durch, den Sie indizieren.

In der Vergangenheit habe ich Suffixe wie 's', 'ed' usw. mit Regex entfernt und dieselbe Regex für die Suchzeichenfolge verwendet. Es ist jedoch nicht ideal. Dies war für eine einfache Website mit nur 200 Seiten.

Wenn Sie sich Sorgen um die Leistung machen, sollten Sie anstelle einer Datenbank die Verwendung einer Suchmaschine wie Lucine (solr) in Betracht ziehen. Dies erleichtert die Indizierung erheblich. Sie wollen das Rad hier nicht neu erfinden.