Freigeben über


Lektion 1: Erstellen der Bike Buyer Mining Struktur

In dieser Lektion erstellen Sie eine Bergbaustruktur, mit der Sie vorhersagen können, ob ein potenzieller Kunde von Adventure Works Cycles ein Fahrrad kauft. Wenn Sie nicht mit Miningstrukturen und deren Rolle im Data Mining vertraut sind, lesen Sie Miningstrukturen (Analysis Services - Data Mining).

Die Bike Buyer-Miningstruktur, die Sie in dieser Lektion erstellen, unterstützt das Hinzufügen von Miningmodellen basierend auf dem Microsoft Clustering AlgorithmMicrosoft Decision Trees Algorithmus. In späteren Lektionen verwenden Sie die Clustering Mining-Modelle, um die verschiedenen Möglichkeiten zu erkunden, wie Kunden gruppiert werden können, und verwenden Entscheidungsbaum-Mining-Modelle, um vorherzusagen, ob ein potenzieller Kunde ein Fahrrad kauft.

CREATE MINING STRUCTURE-Anweisung

Um eine Miningstruktur zu erstellen, verwenden Sie die CREATE MINING STRUCTURE (DMX)-Anweisung. Der Code in der Anweisung kann in die folgenden Teile unterteilt werden:

  • Benennen der Struktur.

  • Definieren der Schlüsselspalte.

  • Definition der Miningspalten.

  • Definieren eines optionalen Testdatensatzes.

Nachfolgend sehen Sie ein generisches Beispiel für den CREATE MINING STRUCTURE-Befehl.

CREATE MINING STRUCTURE [<mining structure name>]  
(  
    <key column>,  
    <mining structure columns>  
)   
WITH HOLDOUT (<holdout specifier>)  

Die erste Zeile des Codes definiert den Namen der Struktur:

CREATE MINING STRUCTURE [<mining structure name>]  

Informationen zum Benennen eines Objekts in Data Mining Extensions (DMX) finden Sie unter Identifiers (DMX).

Die nächste Zeile des Codes definiert die Schlüsselspalte für die Miningstruktur, die eine Entität in den Quelldaten eindeutig identifiziert:

<key column>,  

In der Miningstruktur, die Sie erstellen, definiert der Kundenbezeichner CustomerKeyeine Entität in den Quelldaten.

Die nächste Zeile des Codes wird verwendet, um die Miningspalten zu definieren, die von den Miningmodellen verwendet werden, die der Miningstruktur zugeordnet sind:

<mining structure columns>  

Sie können die Funktion DISCRETIZE in <Miningstrukturspalten> verwenden, um kontinuierliche Spalten mithilfe der folgenden Syntax zu diskretisieren.

DISCRETIZE(<method>,<number of buckets>)

Weitere Informationen zur Diskretisierung von Spalten finden Sie unter Discretization Methods (Data Mining). Weitere Informationen zu den Typen von Miningstrukturspalten, die Sie definieren können, finden Sie unter Mining Structure Columns.

Die letzte Zeile des Codes definiert eine optionale Partition in der Miningstruktur:

WITH HOLDOUT (<holdout specifier>)  

Sie geben einen Teil der Daten an, die zum Testen von Miningmodellen verwendet werden sollen, die mit der Struktur zusammenhängen, und die verbleibenden Daten werden für die Schulung der Modelle verwendet. Standardmäßig erstellt Analysis Services einen Testdatensatz, der 30 Prozent aller Falldaten enthält. Sie fügen die Spezifikation hinzu, dass der Testdatensatz bis zu 1000 Fälle maximal 30 Prozent der Fälle enthalten soll. Wenn 30 Prozent der Fälle kleiner als 1000 sind, enthält der Testdatensatz die kleinere Menge.

Lektionsaufgaben

In dieser Lektion führen Sie die folgenden Aufgaben aus:

  • Erstellen Sie eine neue leere Abfrage.

  • Ändern Sie die Abfrage, um die Miningstruktur zu erstellen.

  • Führen Sie die Abfrage aus.

Erstellen der Abfrage

Der erste Schritt besteht darin, eine Verbindung mit einer Instanz von Analysis Services herzustellen und eine neue DMX-Abfrage in SQL Server Management Studio zu erstellen.

So erstellen Sie eine neue DMX-Abfrage in SQL Server Management Studio

  1. Öffnen Sie SQL Server Management Studio.

  2. Wählen Sie im Dialogfeld "Mit Server verbinden " für den Servertyp"Analysis Services" aus. Geben Sie im ServernameLocalHost ein oder geben Sie den Namen der Instanz von Analysis Services ein, mit der Sie für diese Lektion eine Verbindung herstellen möchten. Klicken Sie auf Verbinden.

  3. Klicken Sie im Objekt-Explorer mit der rechten Maustaste auf die Instanz von Analysis Services, zeigen Sie auf Neue Abfrage und klicken Sie dann auf DMX, um den Abfrage-Editor und eine neue leere Abfrage zu öffnen.

Ändern der Abfrage

Der nächste Schritt besteht darin, die oben beschriebene CREATE MINING STRUCTURE-Anweisung zu ändern, um die Bike Buyer Mining-Struktur zu erstellen.

So passen Sie die CREATE MINING STRUCTURE-Anweisung an

  1. Kopieren Sie im Abfrage-Editor das generische Beispiel der CREATE MINING STRUCTURE-Anweisung in die leere Abfrage.

  2. Ersetzen Sie Folgendes:

    [<mining structure>]   
    

    Durch:

    [Bike Buyer]  
    
  3. Ersetzen Sie Folgendes:

    <key column>   
    

    Durch:

    CustomerKey LONG KEY  
    
  4. Ersetzen Sie Folgendes:

    <mining structure columns>   
    

    Durch:

    [Age] LONG DISCRETIZED(Automatic,10),  
    [Bike Buyer] LONG DISCRETE,  
    [Commute Distance] TEXT DISCRETE,  
    [Education] TEXT DISCRETE,  
    [Gender] TEXT DISCRETE,  
    [House Owner Flag] TEXT DISCRETE,  
    [Marital Status] TEXT DISCRETE,  
    [Number Cars Owned] LONG DISCRETE,  
    [Number Children At Home] LONG DISCRETE,  
    [Occupation] TEXT DISCRETE,  
    [Region] TEXT DISCRETE,  
    [Total Children]LONG DISCRETE,  
    [Yearly Income] DOUBLE CONTINUOUS  
    
  5. Ersetzen Sie Folgendes:

    WITH HOLDOUT (holdout specifier>)  
    

    Durch:

    WITH HOLDOUT (30 PERCENT or 1000 CASES)  
    

    Die vollständige Bergbaustruktur-Anweisung sollte nun wie folgt sein:

    CREATE MINING STRUCTURE [Bike Buyer]  
    (  
       [Customer Key] LONG KEY,  
       [Age]LONG DISCRETIZED(Automatic,10),  
       [Bike Buyer] LONG DISCRETE,  
       [Commute Distance] TEXT DISCRETE,  
       [Education] TEXT DISCRETE,  
       [Gender] TEXT DISCRETE,  
       [House Owner Flag] TEXT DISCRETE,  
       [Marital Status] TEXT DISCRETE,  
       [Number Cars Owned]LONG DISCRETE,  
       [Number Children At Home]LONG DISCRETE,  
       [Occupation] TEXT DISCRETE,  
       [Region] TEXT DISCRETE,  
       [Total Children]LONG DISCRETE,  
       [Yearly Income] DOUBLE CONTINUOUS  
    )  
    WITH HOLDOUT (30 PERCENT or 1000 CASES)  
    
    
  6. Klicken Sie im Menü Datei auf Speichern unter DMXQuery1.dmx.

  7. Navigieren Sie im Dialogfeld " Speichern unter " zum entsprechenden Ordner, und benennen Sie die Datei Bike Buyer Structure.dmx.

Ausführen der Abfrage

Der letzte Schritt besteht darin, die Abfrage auszuführen. Nachdem eine Abfrage erstellt und gespeichert wurde, muss sie ausgeführt werden. Das heißt, die Anweisung muss ausgeführt werden, um die Miningstruktur auf dem Server zu erstellen. Weitere Informationen zum Ausführen von Abfragen im Abfrage-Editor finden Sie im Datenbankmodul-Abfrage-Editor (SQL Server Management Studio).

So führen Sie die Abfrage aus

  1. Klicken Sie im Abfrage-Editor auf der Symbolleiste auf "Ausführen".

    Der Status der Abfrage wird auf der Registerkarte "Nachrichten " unten im Abfrage-Editor angezeigt, nachdem die Ausführung der Anweisung abgeschlossen ist. Nachrichten sollten angezeigt werden:

    Executing the query   
    Execution complete  
    

    Auf dem Server ist nun eine neue Struktur namens Bike Buyer vorhanden.

In der nächsten Lektion fügen Sie der soeben erstellten Struktur Miningmodelle hinzu.

Nächste Lektion

Lektion 2: Hinzufügen von Miningmodellen zur Bike Buyer-Miningstruktur