Sqlserver
 sql >> Datenbank >  >> RDS >> Sqlserver

So ignorieren Sie HTML-Tags in der SQL Server 2008-Volltextsuche

Es gibt einen Filter für .htm- und .html-Dateien.

Um zu sehen, ob Sie den Filter installiert haben, führen Sie diese SQL aus:

SELECT * FROM sys.fulltext_document_types

Sie sollten sehen:

.htm E0CA5340-4534-11CF-B952-00AA0051FE20 C:\Program Files\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSQL\Binn\nlhtml.dll 12.0.6828.0 Microsoft Corporation

.html E0CA5340-4534-11CF-B952-00AA0051FE20 C:\Program Files\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSQL\Binn\nlhtml.dll 12.0.6828.0 Microsoft Corporation

Wenn Sie also Ihre Artikelspalte in varbinary(max) konvertieren können, können Sie ihr einen Volltextindex hinzufügen und den Dokumenttyp „.html“

angeben

Sobald der Index gefüllt ist, können Sie die Schlüsselwörter mit diesem SQL überprüfen:

SELECT display_term, column_id, document_count
FROM sys.dm_fts_index_keywords
(DB_ID('your_db'), OBJECT_ID('your_table'))