Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Die statistische semantische Suche bietet tiefe Einblicke in unstrukturierte Dokumente, die in SQL Server-Datenbanken gespeichert sind, indem statistisch relevante Schlüsselbegriffe extrahiert und indiziert werden. Anschließend werden diese Schlüsselausdrücke auch verwendet, um Dokumente zu identifizieren und zu indizieren , die ähnlich oder verwandt sind.
Sie abfragen diese semantischen Indizes mithilfe von drei Transact-SQL Rowsetfunktionen, um die Ergebnisse als strukturierte Daten abzurufen.
Was kann ich mit der semantischen Suche tun?
Die semantische Suche baut auf dem vorhandenen Volltextsuchfeature in SQL Server auf, ermöglicht aber neue Szenarien, die über Schlüsselwortsuchen hinausgehen. Während die Volltextsuche es Ihnen ermöglicht, die Wörter in einem Dokument abfragen zu können, können Sie mit der semantischen Suche die Bedeutung des Dokuments abfragen. Lösungen, die jetzt möglich sind, umfassen automatische Tagextraktion, verwandte Inhaltsermittlung und hierarchische Navigation über ähnliche Inhalte hinweg. Sie können z. B. den Index der Schlüsselausdrücke abfragen, um die Taxonomie für eine Organisation oder einen Korpus von Dokumenten zu erstellen. Oder Sie können den Dokumentähnlichkeitsindex abfragen, um Lebensläufe zu identifizieren, die einer Auftragsbeschreibung entsprechen.
Die folgenden Beispiele veranschaulichen die Funktionen der semantischen Suche.
Suchen der wichtigsten Ausdrücke in einem Dokument
Die folgende Abfrage ruft die schlüsselausdrücke ab, die im Beispieldokument identifiziert wurden. Es stellt die Ergebnisse in absteigender Reihenfolge nach der Bewertung dar, die die statistische Bedeutung jedes Schlüsselausdrucks bewertet. Diese Abfrage ruft die Semantikkeyphrasetable (Transact-SQL) -Funktion auf.
SET @Title = 'Sample Document.docx'
SELECT @DocID = DocumentID
FROM Documents
WHERE DocumentTitle = @Title
SELECT @Title AS Title, keyphrase, score
FROM SEMANTICKEYPHRASETABLE(Documents, *, @DocID)
ORDER BY score DESC
Suchen nach ähnlichen oder verwandten Dokumenten
Die folgende Abfrage ruft die Dokumente ab, die als ähnlich oder im Zusammenhang mit dem Beispieldokument identifiziert wurden. Es stellt die Ergebnisse in absteigender Reihenfolge nach der Bewertung dar, die die Ähnlichkeit der 2 Dokumente bewertet. Diese Abfrage ruft die Funktion semantisch (Transact-SQL) auf.
SET @Title = 'Sample Document.docx'
SELECT @DocID = DocumentID
FROM Documents
WHERE DocumentTitle = @Title
SELECT @Title AS SourceTitle, DocumentTitle AS MatchedTitle,
DocumentID, score
FROM SEMANTICSIMILARITYTABLE(Documents, *, @DocID)
INNER JOIN Documents ON DocumentID = matched_document_key
ORDER BY score DESC
Suchen der Wichtigsten Ausdrücke, die Dokumente ähnlich oder verwandter machen
Die folgende Abfrage ruft die wichtigsten Ausdrücke ab, die die 2 Beispieldokumente ähnlich oder miteinander verwandt machen. Es stellt die Ergebnisse in absteigender Reihenfolge nach dem Score dar, der die Gewichtung der einzelnen Schlüsselausdrücke bewertet. Diese Abfrage ruft die Semantikdetailstable (Transact-SQL) -Funktion auf.
SET @SourceTitle = 'first.docx'
SET @MatchedTitle = 'second.docx'
SELECT @SourceDocID = DocumentID FROM Documents WHERE DocumentTitle = @SourceTitle
SELECT @MatchedDocID = DocumentID FROM Documents WHERE DocumentTitle = @MatchedTitle
SELECT @SourceTitle AS SourceTitle, @MatchedTitle AS MatchedTitle, keyphrase, score
FROM semanticsimilaritydetailstable(Documents, DocumentContent,
@SourceDocID, DocumentContent, @MatchedDocID)
ORDER BY score DESC
Speichern von Dokumenten in SQL Server
Bevor Sie Dokumente mit der semantischen Suche indizieren können, müssen Sie die Dokumente in einer SQL Server-Datenbank speichern.
Das FileTable-Feature in SQL Server 2014 macht unstrukturierte Dateien und Dokumente erstklassige Bürger der relationalen Datenbank. Daher können Datenbankentwickler Dokumente zusammen mit strukturierten Daten in Transact-SQL setbasierten Vorgängen bearbeiten.
Weitere Informationen zum FileTable-Feature finden Sie unter FileTables (SQL Server).For more information about the FileTables feature, see FileTables (SQL Server). Informationen zum FILESTREAM-Feature, bei dem es sich um eine weitere Option zum Speichern von Dokumenten in der Datenbank handelt, finden Sie unter FILESTREAM (SQL Server).For information about the FILESTREAM feature, which is another option for speicher documents in the database, see FILESTREAM (SQL Server).
Verwandte Aufgaben
Installieren und Konfigurieren der semantischen Suche
Beschreibt die Voraussetzungen für die statistische semantische Suche und deren Installation oder Überprüfung.
Aktivieren der semantischen Suche in Tabellen und Spalten
Beschreibt, wie Sie die statistische semantische Indizierung für ausgewählte Spalten aktivieren oder deaktivieren, die Dokumente oder Text enthalten.
Suchen von Schlüsselausdrücken in Dokumenten mit semantischer Suche
Beschreibt, wie Sie die Schlüsselausdrücke in Dokumenten oder Textspalten finden, die für die statistische semantische Indizierung konfiguriert sind.
Suchen nach ähnlichen und verwandten Dokumenten mit semantischer Suche
Beschreibt, wie ähnliche oder verwandte Dokumente oder Textwerte gefunden werden, und Informationen darüber, wie sie ähnlich oder verknüpft sind, in Spalten, die für die statistische semantische Indizierung konfiguriert sind.
Verwalten und Überwachen der semantischen Suche
Beschreibt den Prozess der semantischen Indizierung und der Aufgaben im Zusammenhang mit der Überwachung und Verwaltung der Indizes.
Verwandte Inhalte
Semantische Such-DDL, Funktionen, gespeicherte Prozeduren und Ansichten
Listet die Transact-SQL Anweisungen und die SQL Server-Datenbankobjekte auf, die zur Unterstützung der statistischen semantischen Suche hinzugefügt oder geändert wurden.