Freigeben über


Data Mining-Abfragen

Data Mining-Abfragen sind für viele Zwecke nützlich. Sie haben folgende Möglichkeiten:

  • Wenden Sie das Modell auf neue Daten an, um einzelne oder mehrere Vorhersagen zu erstellen. Sie können Eingabewerte als Parameter oder in einem Batch bereitstellen.

  • Erhalten Sie eine statistische Zusammenfassung der daten, die für schulungen verwendet werden.

  • Extrahieren Sie Muster und Regeln, oder generieren Sie ein Profil des typischen Falls, das ein Muster im Modell darstellt.

  • Extrahieren Sie Regressionsformeln und andere Berechnungen, die Muster erläutern.

  • Habe Zugriff auf die Fälle, die einem bestimmten Muster entsprechen.

  • Rufen Sie Details zu einzelnen Fällen ab, die im Modell verwendet werden, einschließlich daten, die in der Analyse nicht verwendet werden.

  • Trainieren Sie ein Modell, indem Sie neue Daten hinzufügen oder Kreuzvorhersagen durchführen.

Dieser Abschnitt enthält eine Übersicht über die Informationen, die Sie für die ersten Schritte mit Data Mining-Abfragen benötigen. Es beschreibt die Arten von Abfragen, die Sie für Data Mining-Objekte erstellen können, führt die Abfragetools und Abfragesprachen ein und stellt Links zu Beispielen von Abfragen bereit, die Sie anhand der in SQL Server Data Mining bereitgestellten Algorithmen erstellen können.

Grundlegendes zu Data Mining-Abfragen

Abfragetools und Schnittstellen

Abfragen für verschiedene Modelltypen

Anforderungen

Grundlegendes zu Data Mining-Abfragen

Analysis Services Data Mining unterstützt die folgenden Arten von Abfragen:

  • Vorhersageabfragen (Data Mining)

    Abfragen, die auf der Grundlage von Mustern im Modell und aus den Eingabedaten Rückschlüsse ziehen.

  • Inhaltsabfragen (Data Mining)

    Abfragen, die Metadaten, Statistiken und andere Informationen zum Modell selbst zurückgeben.

  • Drillthrough-Abfragen (Data Mining)

    Abfragen, die die zugrunde liegenden Falldaten für das Modell abrufen können, oder sogar Daten aus der Struktur, die im Modell nicht verwendet wurde.

  • Datendefinitionsabfragen (Data Mining)

    Abfragen, die keine Informationen aus dem Modell zurückgeben, sondern zum Erstellen von Modellen und Strukturen oder zum Aktualisieren der Daten in einem Modell oder einer Struktur verwendet werden.

Bevor Sie Abfragen erstellen, sollten Sie sich mit den Unterschieden zwischen Modellen vertraut machen, die mit den einzelnen von SQL Server bereitgestellten Data Mining-Algorithmen erstellt wurden.

  • Durchsuchen und untersuchen Sie jeden Modelltyp mithilfe der benutzerdefinierten Data Mining-Viewer, die für jeden Algorithmustyp bereitgestellt werden. Weitere Informationen finden Sie unter Mining Model Viewer Tasks and How-tos.

  • Überprüfen Sie den Modellinhalt für jeden Modelltyp mithilfe der Microsoft Generic Content Tree Viewer. Informationen zur Interpretation dieser Daten finden Sie im Miningmodellinhalt (Analysis Services - Data Mining).

Abfragetools und Schnittstellen

Sie können Data Mining-Abfragen interaktiv erstellen, indem Sie eines der abfragetools verwenden, die von SQL Server bereitgestellt werden. Der grafische Vorhersageabfrage-Generator wird sowohl in SQL Server Data Tools (SSDT) als auch in SQL Server Management Studio bereitgestellt. Wenn Sie den Vorhersageabfrage-Generator noch nicht verwendet haben, empfiehlt es sich, die Schritte im Grundlegenden Data Mining-Lernprogramm auszuführen, um sich mit der Benutzeroberfläche vertraut zu machen. Eine kurze Übersicht über die Schritte finden Sie unter Erstellen einer Abfrage mithilfe des Vorhersageabfrage-Generators.

Der Vorhersageabfrage-Generator ist hilfreich beim Starten von Abfragen, die Sie später anpassen werden. Sie können ganz einfach Datenquellen hinzufügen und diese auf Spalten abbilden und dann zum DMX-Modus wechseln, wo Sie die Abfrage anpassen können, indem Sie eine WHERE-Klausel oder andere Funktionen hinzufügen.

Sobald Sie mit Data Mining-Modellen und der Erstellung von Abfragen vertraut sind, können Sie Abfragen auch direkt mithilfe von Data Mining Extensions (DMX) schreiben. DMX ist eine Abfragesprache, die Transact-SQL ähnelt und die Sie von vielen verschiedenen Clients aus verwenden können. ZUR Erstellung von benutzerdefinierten Vorhersagen und komplexen Abfragen ist DAS TOOL DER WAHL. Eine Einführung finden Sie unter Erstellen und Abfragen von Data-Mining-Modellen mit DMX: Tutorials (Analysis Services - Data Mining).

DMX-Editoren sind sowohl in SQL Server Data Tools (SSDT) als auch in SQL Server Management Studio verfügbar. Sie können auch den Vorhersageabfrage-Generator verwenden, um Ihre Abfragen zu starten. Wechseln Sie dann in die Text-Editor-Ansicht und kopieren Sie die DMX-Anweisung in einen anderen Client. Weitere Informationen finden Sie unter Data Mining-Abfrageschnittstellen.

Sie können MITHILFE von AMO oder XMLA programmgesteuert ANWEISUNGEN von Ihrem Client an den Analysis Services-Server senden. ALLERDINGS ist ES DIE Sprache, die Sie zum Erstellen von Abfragen für ein Miningmodell verwenden müssen.

Sie können auch die Metadaten, Statistiken und einige Inhalte des Modells abfragen, indem Sie dynamische Verwaltungsansichten (DYNAMIC Management Views, DMVs) verwenden, die auf den Data Mining-Schema-Rowsets basieren. Diese DMVs erleichtern das Abrufen von Informationen zum Modell durch Eingabe von SELECT-Anweisungen; Sie können jedoch keine Vorhersagen erstellen. Weitere Informationen zu DMVs, die von Analysis Services unterstützt werden, finden Sie unter Verwenden von dynamischen Verwaltungsansichten (Dynamic Management Views, DMVs) zum Überwachen von Analysis Services.

Schließlich können Sie Data Mining-Abfragen für die Verwendung in Integration Services-Paketen erstellen, indem Sie die Data Mining-Abfrageaufgabe oder die Data Mining-Abfragetransformation verwenden. Die Kontrollflussaufgabe unterstützt mehrere Typen von DMX-Abfragen, während die Datenflusstransformation nur solche Abfragen unterstützt, die mit Daten im Datenfluss arbeiten, also Abfragen, die die PREDICTION JOIN-Syntax verwenden.

Abfragen für verschiedene Modelltypen

Der Algorithmus, der beim Erstellen des Modells verwendet wurde, beeinflusst stark den Informationstyp, den Sie aus einer Data Mining-Abfrage abrufen können. Der Grund für die Unterschiede besteht darin, dass jeder Algorithmus die Daten anders verarbeitet und verschiedene Arten von Mustern speichert. Beispielsweise erstellen einige Algorithmen Cluster; andere erstellen Bäume. Daher müssen Sie je nach Typ des Modells, mit dem Sie arbeiten, möglicherweise spezielle Vorhersage- und Abfragefunktionen verwenden.

Die folgende Liste enthält eine Zusammenfassung der Funktionen, die Sie in Abfragen verwenden können:

  • Allgemeine Vorhersagefunktionen: Die Predict Funktion ist polymorph, was bedeutet, dass sie mit allen Modelltypen funktioniert. Diese Funktion erkennt automatisch den Typ des Modells, mit dem Sie arbeiten, und fordert Sie zur Eingabe zusätzlicher Parameter auf. Weitere Informationen finden Sie unter Predict (DMX).

    Warnung

    Nicht alle Modelle werden verwendet, um Vorhersagen zu erstellen. Sie können z. B. ein Clusteringmodell erstellen, das kein vorhersagbares Attribut besitzt. Auch wenn ein Modell nicht über ein vorhersagbares Attribut verfügt, können Sie Vorhersageabfragen erstellen, die andere Arten nützlicher Informationen aus dem Modell zurückgeben.

  • Benutzerdefinierte Vorhersagefunktionen: Jeder Modelltyp stellt eine Reihe von Vorhersagefunktionen bereit, die für das Arbeiten mit den mustern entwickelt wurden, die von diesem Algorithmus erstellt wurden.

    Beispielsweise wird die Lag Funktion für Zeitreihenmodelle bereitgestellt, damit Sie die für das Modell verwendeten historischen Daten anzeigen können. Bei Clusteringmodellen sind Funktionen wie ClusterDistance aussagekräftiger.

    Weitere Informationen zu den Funktionen, die für jeden Modelltyp unterstützt werden, finden Sie unter den folgenden Links:

    Beispiele für Zuordnungsmodellabfragen Microsoft Naive Bayes-Algorithmus
    Beispiele für Clusteringmodellabfragen Beispiele für neurale Netzwerkmodellabfragen
    Beispiele für Decision Trees-Modellabfragen Beispiele für Sequenzclusteringmodellabfragen
    Beispiele für lineare Regressionsmodellabfragen Abfragebeispiele für Zeitreihenmodelle
    Beispiele für Die Abfrage des Logistischen Regressionsmodells

    Sie können auch VBA-Funktionen aufrufen oder eigene Funktionen erstellen. Weitere Informationen finden Sie unter Functions (DMX).

  • Allgemeine Statistiken: Es gibt eine Reihe von Funktionen, die mit fast jedem Modelltyp verwendet werden können, die einen Standardsatz beschreibender Statistiken zurückgeben, z. B. Die Standardabweichung.

    Beispielsweise gibt die PredictHistogram Funktion eine Tabelle zurück, die alle Zustände der angegebenen Spalte auflistet.

    Weitere Informationen finden Sie unter Allgemeine Vorhersagefunktionen (DMX).

  • Benutzerdefinierte Statistiken: Zusätzliche unterstützende Funktionen werden für jeden Modelltyp bereitgestellt, um Statistiken zu generieren, die für die spezifische Analyseaufgabe relevant sind.

    Wenn Sie beispielsweise mit einem Clusteringmodell arbeiten, können Sie die Funktion verwenden, um die Wahrscheinlichkeitsbewertung zurückzugeben, PredictCaseLikelihooddie einem bestimmten Fall und Cluster zugeordnet ist. Wenn Sie jedoch ein lineares Regressionsmodell erstellt haben, sind Sie mehr daran interessiert, den Koeffizienten und den Schnittpunkt abzurufen, den Sie mit einer Inhaltsabfrage ausführen können.

  • Modellinhaltsfunktionen: Der Inhalt aller Modelle wird in einem standardisierten Format dargestellt, mit dem Sie Informationen mit einer einfachen Abfrage abrufen können. Sie erstellen Abfragen zum Modellinhalt mithilfe von DMX. Sie können auch einen Typ von Modellinhalt abrufen, indem Sie die Data Mining-Schema-Rowsets verwenden.

    Im Modellinhalt unterscheidet sich die Bedeutung jeder Zeile oder jedes Knotens der zurückgegebenen Tabelle je nach Typ des Algorithmus, der zum Erstellen des Modells verwendet wurde, sowie vom Datentyp der Spalte. Weitere Informationen finden Sie unter Inhaltsabfragen (Data Mining).

Anforderungen

Bevor Sie eine Abfrage für ein Modell erstellen können, muss das Data Mining-Modell verarbeitet worden sein. Für die Verarbeitung von Analysis Services-Objekten sind spezielle Berechtigungen erforderlich. Weitere Informationen zur Verarbeitung von Miningmodellen finden Sie unter "Verarbeitungsanforderungen und Überlegungen "(Data Mining)".

Zum Ausführen von Abfragen für ein Data Mining-Modell sind je nach Art der ausgeführten Abfrage unterschiedliche Berechtigungsebenen erforderlich. Beispielsweise benötigen Drillthrough für Fall- oder Strukturdaten in der Regel zusätzliche Berechtigungen, die für das Miningstrukturobjekt oder das Miningmodellobjekt festgelegt werden können.

Wenn Ihre Abfrage jedoch externe Daten verwendet und Anweisungen wie OPENROWSET oder OPENQUERY enthält, muss die datenbank, die Sie abfragen, diese Anweisungen aktivieren, und Sie müssen über die Berechtigung für die zugrunde liegenden Datenbankobjekte verfügen.

Weitere Informationen zu den Sicherheitskontexten, die zum Ausführen von Data Mining-Abfragen erforderlich sind, finden Sie unter Security Overview (Data Mining)

In diesem Abschnitt

In den Themen in diesem Abschnitt werden die einzelnen Datentypen von Data Mining-Abfragen ausführlicher vorgestellt und Links zu detaillierten Beispielen zum Erstellen von Abfragen für Data Mingin-Modelle bereitgestellt.

Vorhersageabfragen (Data Mining)

Inhaltsabfragen (Data Mining)

Drillthrough-Abfragen (Data Mining)

Datendefinitionsabfragen (Data Mining)

Data Mining-Abfrageschnittstellen

Verwenden Sie diese Links, um zu erfahren, wie Sie Data Mining-Abfragen erstellen und verwenden.

Aufgaben Verknüpfungen
Anzeigen von Lernprogrammen und exemplarischen Vorgehensweisen für Data Mining-Abfragen Lektion 6: Erstellen und Arbeiten mit Vorhersagen (Grundlegendes Data Mining-Lernprogramm)

DMX-Zeitreihen-Vorhersage-Tutorial
Verwenden von Data Mining-Abfragetools in SQL Server Management Studio und SQL Server Data Tools (SSDT) Erstellen Sie eine DMX-Abfrage in SQL Server Management Studio

Erstellen einer Vorhersageabfrage mithilfe des Vorhersageabfrage-Generators

Anwenden von Vorhersagefunktionen auf ein Modell

Manuelles Bearbeiten einer Vorhersageabfrage
Arbeiten mit externen Daten, die in Vorhersageabfragen verwendet werden Auswählen und Zuordnen von Eingabedaten für eine Vorhersageabfrage

Auswählen und Zuordnen von Eingabedaten für eine Vorhersageabfrage
Arbeiten mit den Ergebnissen von Abfragen Anzeigen und Speichern der Ergebnisse einer Vorhersageabfrage
Verwenden von XMLA- und XMLA-Abfragevorlagen, die in Management Studio bereitgestellt werden Erstellen einer Singleton-Vorhersageabfrage aus einer Vorlage

Erstellen einer Data Mining-Abfrage mithilfe von XMLA

Verwenden von Analysis Services-Vorlagen in SQL Server Management Studio
Weitere Informationen zu Inhaltsabfragen und Beispiele Erstellen einer Inhaltsabfrage für ein Miningmodell

Abfragen der Parameter, die zum Erstellen eines Miningmodells verwendet werden

Inhaltsabfragen (Data Mining)
Festlegen von Abfrageoptionen und Behandeln von Abfrageberechtigungen und Problemen Ändern des Timeoutwerts für Data Mining-Abfragen
Verwenden der Data Mining-Komponenten in Integration Services Data Mining-Abfragetask

Transformation für Data Mining-Abfragen

Siehe auch

Data Mining-Algorithmen (Analysis Services - Data Mining)
Inhalt des Mining-Modells (Analysis Services - Data Mining)