Sqlserver
 sql >> Datenbank >  >> RDS >> Sqlserver

Trennen Sie die Wörter gruppenweise für jede Zeile in SQL

Wow, Sie sollten Ihre Tische neu gestalten. Wie auch immer, hier ist mein Versuch mit DelimitedSplit8k von Jeff Moden .

Ich glaube, Sie haben diese Funktion jetzt, da ich eine Ihrer vorherigen Fragen beantwortet habe die diese Funktion ebenfalls verwendet.

Zuerst möchten Sie Ihren @string aufteilen Eingabe in separate Zeilen. Sie sollten auch die Group_Words aufteilen Tabelle.

Danach machen Sie einen LEFT JOIN um die passenden Kategorien zu erhalten. Dann eliminieren Sie die ungültigen Wörter.

Sehen Sie es hier in Aktion:SQL Fiddle

DECLARE @string VARCHAR(8000)
SET @string = 'No People,Day,side view,looking at camera,snow,mountain,tranquil scene,tranquility,Night,walking,water,Two Person,looking Down'

-- Split @string variable
DECLARE @tbl_string AS TABLE(ItemNumber INT, Item VARCHAR(8000))
INSERT INTO @tbl_string
SELECT
    ItemNumber, LTRIM(RTRIM(Item))
FROM dbo.DelimitedSplit8K(@string, ',')

-- Normalize Group_Words
DECLARE @tbl_grouping AS TABLE(Category VARCHAR(20), ItemNumber INT, Item VARCHAR(8000))
INSERT INTO @tbl_grouping
SELECT
    w.Category, s.ItemNumber, LTRIM(RTRIM(s.Item))
FROM Group_Words w
CROSS APPLY dbo.DelimitedSplit8K(w.[Group], ',')s

;WITH Cte AS(
    SELECT      
        s.ItemNumber,
        s.Item,
        g.category,     
        RN = ROW_NUMBER() OVER(PARTITION BY g.Category ORDER BY s.ItemNumber)
    FROM @tbl_string s
    LEFT JOIN @tbl_grouping g
        ON g.Item = s.Item
)
SELECT STUFF((
        SELECT ',' + Item
        FROM Cte
        WHERE 
            RN = 1
            OR Category IS NULL
        ORDER BY ItemNumber
        FOR XML PATH(''), TYPE).value('.', 'VARCHAR(MAX)'),
    1, 1, '')

AUSGABE :

|                                                                                                  |
|--------------------------------------------------------------------------------------------------|
| No People,Day,side view,looking at camera,snow,mountain,tranquil scene,tranquility,walking,water |

Wenn Ihr @string input hat mehr als 8000 Zeichen, der DelimitedSplit8K wird langsamer. Sie können stattdessen andere Splitter verwenden. Hier ist einer für den Artikel von Sir Aaron Bertrands .

CREATE FUNCTION dbo.SplitStrings_XML
(
   @List       NVARCHAR(MAX),
   @Delimiter  NVARCHAR(255)
)
RETURNS TABLE
WITH SCHEMABINDING
AS
   RETURN 
   (  
      SELECT Item = y.i.value('(./text())[1]', 'nvarchar(4000)')
      FROM 
      ( 
        SELECT x = CONVERT(XML, '<i>' 
          + REPLACE(@List, @Delimiter, '</i><i>') 
          + '</i>').query('.')
      ) AS a CROSS APPLY x.nodes('i') AS y(i)
   );
GO