Semantische Suche (SQL Server)

Die statistische semantische Suche bietet tiefe Einblicke in unstrukturierte Dokumente, die in SQL Server-Datenbanken gespeichert sind, indem statistisch relevante Schlüsselbegriffe extrahiert und indiziert werden. Anschließend werden diese Schlüsselausdrücke auch verwendet, um Dokumente zu identifizieren und zu indizieren , die ähnlich oder verwandt sind.

Sie abfragen diese semantischen Indizes mithilfe von drei Transact-SQL Rowsetfunktionen, um die Ergebnisse als strukturierte Daten abzurufen.

Was kann ich mit der semantischen Suche tun?

Die semantische Suche baut auf dem vorhandenen Volltextsuchfeature in SQL Server auf, ermöglicht aber neue Szenarien, die über Schlüsselwortsuchen hinausgehen. Während die Volltextsuche es Ihnen ermöglicht, die Wörter in einem Dokument abfragen zu können, können Sie mit der semantischen Suche die Bedeutung des Dokuments abfragen. Lösungen, die jetzt möglich sind, umfassen automatische Tagextraktion, verwandte Inhaltsermittlung und hierarchische Navigation über ähnliche Inhalte hinweg. Sie können z. B. den Index der Schlüsselausdrücke abfragen, um die Taxonomie für eine Organisation oder einen Korpus von Dokumenten zu erstellen. Oder Sie können den Dokumentähnlichkeitsindex abfragen, um Lebensläufe zu identifizieren, die einer Auftragsbeschreibung entsprechen.

Die folgenden Beispiele veranschaulichen die Funktionen der semantischen Suche.

Suchen der wichtigsten Ausdrücke in einem Dokument

Die folgende Abfrage ruft die schlüsselausdrücke ab, die im Beispieldokument identifiziert wurden. Es stellt die Ergebnisse in absteigender Reihenfolge nach der Bewertung dar, die die statistische Bedeutung jedes Schlüsselausdrucks bewertet. Diese Abfrage ruft die Semantikkeyphrasetable (Transact-SQL) -Funktion auf.

SET @Title = 'Sample Document.docx'  
  
SELECT @DocID = DocumentID  
    FROM Documents  
    WHERE DocumentTitle = @Title  
  
SELECT @Title AS Title, keyphrase, score  
    FROM SEMANTICKEYPHRASETABLE(Documents, *, @DocID)  
    ORDER BY score DESC

Suchen nach ähnlichen oder verwandten Dokumenten

Die folgende Abfrage ruft die Dokumente ab, die als ähnlich oder im Zusammenhang mit dem Beispieldokument identifiziert wurden. Es stellt die Ergebnisse in absteigender Reihenfolge nach der Bewertung dar, die die Ähnlichkeit der 2 Dokumente bewertet. Diese Abfrage ruft die Funktion semantisch (Transact-SQL) auf.

SET @Title = 'Sample Document.docx'  
  
SELECT @DocID = DocumentID  
    FROM Documents  
    WHERE DocumentTitle = @Title  
  
SELECT @Title AS SourceTitle, DocumentTitle AS MatchedTitle,  
        DocumentID, score  
    FROM SEMANTICSIMILARITYTABLE(Documents, *, @DocID)  
    INNER JOIN Documents ON DocumentID = matched_document_key  
    ORDER BY score DESC

Suchen der Wichtigsten Ausdrücke, die Dokumente ähnlich oder verwandter machen

Die folgende Abfrage ruft die wichtigsten Ausdrücke ab, die die 2 Beispieldokumente ähnlich oder miteinander verwandt machen. Es stellt die Ergebnisse in absteigender Reihenfolge nach dem Score dar, der die Gewichtung der einzelnen Schlüsselausdrücke bewertet. Diese Abfrage ruft die Semantikdetailstable (Transact-SQL) -Funktion auf.

SET @SourceTitle = 'first.docx'  
SET @MatchedTitle = 'second.docx'  
  
SELECT @SourceDocID = DocumentID FROM Documents WHERE DocumentTitle = @SourceTitle  
SELECT @MatchedDocID = DocumentID FROM Documents WHERE DocumentTitle = @MatchedTitle  
  
SELECT @SourceTitle AS SourceTitle, @MatchedTitle AS MatchedTitle, keyphrase, score  
    FROM semanticsimilaritydetailstable(Documents, DocumentContent,  
        @SourceDocID, DocumentContent, @MatchedDocID)  
    ORDER BY score DESC

Speichern von Dokumenten in SQL Server

Bevor Sie Dokumente mit der semantischen Suche indizieren können, müssen Sie die Dokumente in einer SQL Server-Datenbank speichern.

Das FileTable-Feature in SQL Server 2014 macht unstrukturierte Dateien und Dokumente erstklassige Bürger der relationalen Datenbank. Daher können Datenbankentwickler Dokumente zusammen mit strukturierten Daten in Transact-SQL setbasierten Vorgängen bearbeiten.

Weitere Informationen zum FileTable-Feature finden Sie unter FileTables (SQL Server).For more information about the FileTables feature, see FileTables (SQL Server). Informationen zum FILESTREAM-Feature, bei dem es sich um eine weitere Option zum Speichern von Dokumenten in der Datenbank handelt, finden Sie unter FILESTREAM (SQL Server).For information about the FILESTREAM feature, which is another option for speicher documents in the database, see FILESTREAM (SQL Server).

Freigeben über

Semantische Suche (SQL Server)

Was kann ich mit der semantischen Suche tun?

Suchen der wichtigsten Ausdrücke in einem Dokument

Suchen nach ähnlichen oder verwandten Dokumenten

Suchen der Wichtigsten Ausdrücke, die Dokumente ähnlich oder verwandter machen

Speichern von Dokumenten in SQL Server

Verwandte Aufgaben

Verwandte Inhalte

Zusätzliche Ressourcen