Freigeben über


Übergreifende Überprüfung (Registerkarte, Mininggenauigkeitsdiagramm-Sicht)

Mithilfe der übergreifenden Überprüfung können Sie eine Miningstruktur in Querschnitte partitionieren und Modelle anhand der einzelnen Querschnitte iterativ trainieren und testen. Sie geben eine Anzahl von Aufteilungen für die Daten an. Die einzelnen Aufteilungen werden der Reihe nach als Testdaten verwendet, während mit den jeweils verbleibenden Daten ein neues Modell trainiert wird. Analysis Services generiert dann eine Reihe von Standardgenauigkeitsmetriken für jedes Modell. Durch den Vergleich der Metriken für die für die einzelnen Querschnitte generierten Modelle erhalten Sie Aufschluss über die Zuverlässigkeit des Miningmodells für das ganze Dataset.

Weitere Informationen finden Sie unter Cross-Validation (Analysis Services – Data Mining).

Hinweis

Die Kreuzüberprüfung kann nicht mit Modellen verwendet werden, die mit dem Microsoft Time Series-Algorithmus oder dem Microsoft Sequence Clustering-Algorithmus erstellt wurden. Wenn Sie den Bericht für eine Miningstruktur mit diesen Typen von Modellen ausführen, werden die Modelle im Bericht nicht berücksichtigt.

Aufgabenliste

  • Geben Sie die Anzahl von Aufteilungen an.

  • Geben Sie die maximale Anzahl von Fällen an, die für die übergreifende Überprüfung zu verwenden sind.

  • Geben Sie die vorhersagbare Spalte an.

  • Geben Sie optional einen vorhersagbaren Status an.

  • Legen Sie optional Parameter fest, mit denen gesteuert wird, wie die Genauigkeit der Vorhersage bewertet wird.

  • Klicken Sie auf Ergebnisse abrufen , um die Ergebnisse der übergreifenden Überprüfung anzuzeigen.

Liste der Benutzeroberflächenelemente

Faltungsanzahl
Geben Sie die Anzahl von zu erstellenden Aufteilungen (oder Partitionen) an. Der Minimalwert ist 2. Das bedeutet, dass die eine Hälfte des Datasets zum Testen und die andere zum Trainieren verwendet wird.

Der Maximalwert für Sitzungsminingstrukturen ist 10.

Der Maximalwert ist 256, wenn die Miningstruktur in einer Instanz von Analysis Services gespeichert wird.

Hinweis

Wenn Sie die Anzahl der Aufteilungen erhöhen, verlängert sich entsprechend auch die für die Ausführung der Kreuzvalidierung erforderliche Zeit um n. Wenn der Wert von Foldanzahl zu hoch ist, können unter Umständen Leistungsprobleme auftreten.

Max. Fälle
Geben Sie die maximale Anzahl von Fällen an, die für die übergreifende Überprüfung zu verwenden sind. Die Anzahl von Fällen in einer bestimmten Aufteilung entspricht dem Wert Maximale Anzahl von Fällen geteilt durch den Wert Foldanzahl .

Wenn Sie 0verwenden, werden alle Fälle in den Quelldaten für die übergreifende Überprüfung verwendet.

Es ist kein Standardwert vorhanden.

Hinweis

In dem Maße, in dem Sie die Anzahl von Fällen erhöhen, nimmt auch die Verarbeitungszeit zu.

Target-Attribut
Wählen Sie in der Liste der in allen Modellen vorhandenen vorhersagbaren Spalten eine Spalte aus. Sie können jeweils nur eine vorhersagbare Spalte auswählen, wenn Sie eine übergreifende Überprüfung ausführen.

Wählen Sie Clusteraus, wenn Sie nur Clustermodelle testen möchten.

Sollzustand
Geben Sie einen Wert ein, oder wählen Sie in einer Dropdownliste von Werten einen Zielwert aus.

Der Standardwert ist null. Dieser gibt an, dass alle Status zu testen sind.

Bei Clustermodellen deaktiviert.

Zielschwellenwert
Geben Sie einen Wert zwischen 0 und 1 an, mit dem die Vorhersagewahrscheinlichkeit angegeben wird, oberhalb derer ein vorhergesagter Status als richtig gewertet wird. Der Wert kann in Schritten von 0,1 festgelegt werden.

Der Standardwert ist null. Dieser gibt an, dass die wahrscheinlichste Vorhersage als richtig gewertet wird.

Hinweis

Sie können den Wert zwar auf 0,0 festlegen, dadurch wird jedoch die Verarbeitungszeit erhöht, und es werden keine brauchbaren Ergebnisse geliefert.

Ergebnisse abrufen
Klicken Sie hierauf, um die übergreifende Überprüfung des Modells mit den angegebenen Parametern zu starten.

Das Modell wird in die angegebene Anzahl von Aufteilungen partitioniert, und für jede Aufteilung wird ein separates Modell getestet. Deshalb kann es einige Zeit dauern, bis die übergreifende Überprüfung Ergebnisse zurückgibt.

Weitere Informationen zum Interpretieren der Ergebnisse des Berichts für die übergreifende Überprüfung finden Sie unter Measures im Kreuzvalidierungsbericht.

Festlegen des Genauigkeitsschwellenwerts

Sie können den Standard für die Messung der Vorhersagegenauigkeit steuern, indem Sie einen Wert für den Zielschwellenwertfestlegen. Ein Schwellenwert stellt eine Art von Genauigkeitsleiste dar. Jeder Vorhersage wird eine Wahrscheinlichkeit der Richtigkeit des vorhergesagten Werts zugewiesen. Wenn Sie daher den Zielschwellenwert näher auf 1 festlegen, müssen Sie festlegen, dass die Wahrscheinlichkeit für eine bestimmte Vorhersage relativ hoch ist, als gute Vorhersage zu zählen. Wenn Sie hingegen den Zielschwellenwertnäher auf 0 festlegen, werden sogar Vorhersagen mit niedrigeren Wahrscheinlichkeitswerten als "gute" Vorhersagen gezählt.

Es gibt keinen empfohlenen Schwellenwert, da die Wahrscheinlichkeit einer Vorhersage von der Datenmenge und dem Typ der Vorhersage abhängt. Prüfen Sie einige Vorhersagen auf verschiedenen Wahrscheinlichkeitsstufen, um eine geeignete Genauigkeitsleiste für Ihre Daten zu bestimmen. Dies ist wichtig, da sich der wert, den Sie für den Zielschwellenwertfestgelegt haben, auf die gemessene Genauigkeit des Modells auswirkt.

Angenommen, es werden drei Vorhersagen für einen bestimmten Zielstatus erstellt, und die Wahrscheinlichkeiten für die einzelnen Vorhersagen liegen bei 0,05, 0,15 und 0,8. Wenn Sie den Schwellenwert auf 0,5 festgelegt haben, wird nur eine Vorhersage als richtig gewertet. Wenn Sie den Zielschwellenwert auf 0,10 festlegen, werden zwei Vorhersagen als richtig gezählt.

Wenn "Zielschwellenwert" auf null", also der Standardwert, festgelegt ist, wird die wahrscheinlichste Vorhersage für jeden Fall als richtig gezählt. In dem gerade genannten Beispiel sind 0,05, 0,15 und 0,8 die Wahrscheinlichkeiten für Vorhersagen in drei verschiedenen Fällen. Obwohl die Wahrscheinlichkeiten sehr unterschiedlich sind, würde jede Vorhersage als richtig gewertet, da jeder Fall nur eine Vorhersage generiert und es sich dabei um die besten Vorhersagen für diese Fälle handelt.

Weitere Informationen

Testen und Überprüfen (Data Mining)
Kreuzvalidierung (Analysis Services - Data Mining)
Measures im Kreuzvalidierungsbericht
Gespeicherte Data Mining-Verfahren (Analysis Services - Data Mining)