Freigeben über


Auswahl und Zuordnung von Modelldaten für Tests

Zum Erstellen eines Genauigkeitsdiagramms in Analysis Services müssen Sie die Daten auswählen, die zum Testen des Modells verwendet werden, und die Daten dem Modell zuordnen.

Standardmäßig verwendet Analysis Services die Testdaten des Miningmodells, vorausgesetzt, Sie haben beim Erstellen der Miningstruktur ein Holdout-Datensatz erstellt. Das Erstellen eines Holdout-Testsatzes ist die einfachste Möglichkeit, Modelle zu testen, die auf derselben Miningstruktur basieren, da die Spaltennamen und Datentypen immer mit dem Modell übereinstimmen, und Sie können vernünftigerweise sicher sein, dass die Verteilung der Daten ähnlich ist. Außerdem erstellt der Designer automatisch die Beziehungen zwischen den Eingabe- und Modellspalten.

Alternativ können Sie eine externe Datenquelle angeben. Für externe Daten gibt es einige zusätzliche Anforderungen:

  • Der externe Datensatz muss als Datenquellenansicht in einer Instanz von Analysis Services definiert werden.

  • Das externe Dataset muss mindestens eine Spalte enthalten, die der vorhersagbaren Spalte im Miningmodell zugeordnet werden kann. Sie können auswählen, dass einige Spalten ignoriert werden sollen.

  • Sie können in einer anderen Datenquellenansicht keine neuen Spalten oder Zuordnungsspalten hinzufügen. Die ausgewählte Datenquellenansicht muss alle Spalten enthalten, die Sie für die Vorhersageabfrage benötigen.

  • Wenn die Namen der externen Spalten exakt mit denen im Modell übereinstimmen, ordnet der Designer sie für Sie zu. Wenn die Zuordnungen falsch sind, können Sie sie ändern oder neue Zuordnungen für vorhandene Spalten löschen und erstellen.

  • Wenn Sie eine externe Datenquelle verwenden, können Sie Filter anwenden, um die Testdaten auf eine relevante Teilmenge von Fällen einzuschränken.

  • Auch wenn Sie den Holdout-Testsatz verwenden, sollten Sie beachten, dass Filter Unterschiede zwischen den Testdaten verursachen können, die einer Miningstruktur zugeordnet sind, und den Testfällen des Miningmodells.

In diesem Thema wird beschrieben, wie Sie die Testdaten auswählen und zuordnen:

Wählen Sie Eingabetabellen aus, um die Genauigkeit eines Miningmodells zu testen.

Zuordnen von Modellspalten zu den Spalten in den Testdaten

Ändern der Art und Weise, wie Spalten in den Testdaten dem Modell zugeordnet werden

So wählen Sie Eingabetabellen aus, um die Genauigkeit eines Miningmodells zu testen

  1. Doppelklicken Sie im Data Mining-Designer in SQL Server Data Tools (SSDT) auf die Miningstruktur, die die Modelle enthält, die Sie diagrammen möchten.

  2. Wählen Sie die Registerkarte "Mining-Genauigkeitsdiagramm" aus .

  3. Wählen Sie auf der Registerkarte "Eingabeauswahl" in der Ansicht " Mining accuracy Chart" eine der folgenden Optionen aus:

    Verwenden von Miningmodelltestfällen

    Verwenden von Miningstrukturtestfällen

    Angeben eines anderen Datasets

  4. Wenn Sie einen anderen Datensatz angeben ausgewählt haben, klicken Sie optional auf "Filter-Editor öffnen ", um Filterbedingungen für den Eingabedatensatz zu erstellen. Klicke auf OK.

  5. Klicken Sie auf die Registerkarte " Diagramm anheben " oder auf die Registerkarte "Klassifizierungsmatrix ", um das Diagramm automatisch mithilfe der von Ihnen angegebenen Testdaten zu erstellen.

So ordnen Sie modellspalten den Spalten in den Testdaten zu

  1. Doppelklicken Sie auf die Miningstruktur, die die Modelle enthält, die Sie visualisieren möchten, um die Struktur und Modelle im Data-Mining-Designer zu öffnen.

  2. Wählen Sie die Registerkarte "Mininggenauigkeitsdiagramm" und dann die Registerkarte " Eingabeauswahl" aus .

  3. Wählen Sie auf der Registerkarte " Eingabeauswahl " unter "Datensatz auswählen", der für das Genauigkeitsdiagramm verwendet werden soll, eine andere Datenmenge angeben aus.

  4. Klicken Sie auf die Schaltfläche "Durchsuchen " (...) , um ein Dialogfeld zu öffnen und die Definition des externen Datasets zu erstellen.

  5. Wählen Sie im Dialogfeld "Miningstruktur auswählen" die Miningstruktur aus, die die Modelle enthält, mit denen Sie arbeiten möchten, und klicken Sie dann auf "OK".

  6. Klicken Sie auf der Registerkarte "Mining-Genauigkeitsdiagramm" in der Tabelle "Eingabetabelle(n) auswählen" auf "Falltabelle auswählen", um das Dialogfeld "Tabelle auswählen" zu öffnen.

  7. Wählen Sie im Dialogfeld "Tabelle auswählen" eine Datenquelle aus der Liste "Datenquelle" aus. Wählen Sie eine Tabelle aus, die die Daten enthält, die Sie in den Vorhersageabfragen verwenden möchten, um die Genauigkeit der Modelle zu bestimmen.

  8. Wählen Sie im Feld "Tabellen-/Ansichtsname " die Tabelle aus, die die Daten enthält, die Sie zum Testen der Modelle verwenden möchten.

  9. Bearbeiten Sie die Zuordnungen bei Bedarf. Spalten in der Miningstruktur werden automatisch den Spalten mit demselben Namen in der Eingabetabelle zugeordnet. Um Zuordnungen manuell zu erstellen, klicken Sie auf eine Spalte in der Tabelle "Eingabetabelle(n) auswählen ", und ziehen Sie sie in die entsprechende Spalte in der Tabelle "Miningstruktur ". Klicken Sie zum Löschen einer Zuordnung auf die Zeile, die die Spalte in der Tabelle "Miningstruktur " mit der zugeordneten Spalte in der Tabelle "Eingabetabelle(n) auswählen " verknüpft, und drücken Sie dann ENTF.

  10. Klicke auf OK.

So ändern Sie die Art der Zuordnung von Eingabedaten zum Modell

  1. Doppelklicken Sie im Data Mining-Designer auf die Struktur, die die Modelle enthält, die Sie diagrammen möchten.

  2. Wählen Sie die Registerkarte "Mining-Genauigkeitsdiagramm" aus .

  3. Klicken Sie auf die Registerkarte " Eingabeauswahl ".

  4. Wählen Sie Datensatz für Genauigkeitsdiagramm aus, wählen Sie die Option Einen anderen Datensatz angeben.

  5. Klicken Sie auf die Schaltfläche "Durchsuchen " (...) , um ein Dialogfeld zu öffnen und die Definition der externen Datenquelle zu erstellen.

  6. Klicken Sie im Dialogfeld "Spaltenzuordnung angeben " auf " Falltabelle auswählen".

  7. Wählen Sie im Dialogfeld "Tabelle auswählen" eine Datenquellenansicht aus der Liste aus, und wählen Sie die Tabelle aus, die die Falldaten enthält. Klicke auf OK.

  8. Wenn die benötigten Tabellen nicht verfügbar sind, schließen Sie das Dialogfeld, und erstellen Sie eine neue Datenquellenansicht, die die Tabelle enthält. Informationen zum Erstellen einer Datenquellenansicht finden Sie unter Definieren einer Datenquellenansicht (Analysis Services).

  9. Wenn das Miningmodell eine geschachtelte Tabelle enthält, klicken Sie auf " Geschachtelte Tabelle auswählen", und wählen Sie die geschachtelte Tabelle aus der Liste der Tabellen in der Datenquellenansicht aus. Klicke auf OK.

  10. Wählen Sie die Verknüpfungslinie der Zuordnung aus, die Sie ändern möchten, und wählen Sie " Verbindungen ändern" aus.

    Das Dialogfeld "Zuordnung ändern " wird geöffnet. In der Tabelle in diesem Dialogfeld listet die Miningstrukturspalte jede Spalte auf, die die ausgewählte Miningstruktur enthält, und Die Tabellenspalte listet die Spalten aus Eingabetabellen auf, die Spalten in der Miningstruktur zugeordnet sind.

  11. Wählen Sie unter "Tabellenspalte" die Zeile aus, die der Zeile unter "Miningstrukturspalte" entspricht, für die Sie eine Beziehung ändern möchten. Wählen Sie eine neue Spalte aus der Liste aus, oder wählen Sie den leeren Eintrag aus der Liste aus, um die Spalte zu löschen.

  12. Klicke auf OK.

    Die neuen Spaltenzuordnungen werden im Dialogfeld "Spaltenzuordnung angeben " angezeigt. Sie können eine Zuordnung entfernen, indem Sie die Linie zwischen den Spalten auswählen und die ENTF-TASTE drücken. Sie können eine neue Verbindung erstellen, indem Sie eine Spalte in der Tabelle "Miningstruktur " auswählen und sie in die entsprechende Spalte in der Tabelle "SelectInput Table(s) " ziehen.

Siehe auch

Test- und Validierungsaufgaben und Vorgehensweisen (Data Mining)