Freigeben über


Anpassen von Miningmodellen und -struktur

Nachdem Sie einen Algorithmus ausgewählt haben, der Ihren Geschäftlichen Anforderungen entspricht, können Sie das Miningmodell auf folgende Weise anpassen, um die Ergebnisse potenziell zu verbessern.

  • Verwenden Sie unterschiedliche Datenspalten im Modell, oder ändern Sie die Verwendungs-, Inhaltstyp- oder Diskretisierungsmethode für die Spalten.

  • Erstellen Sie Filter für das Miningmodell, um die in der Schulung des Modells verwendeten Daten einzuschränken.

  • Ändern Sie den Algorithmus, der zum Analysieren von Daten verwendet wurde.

  • Legen Sie Algorithmusparameter fest, um Schwellenwerte, Baumteilungen und andere wichtige Bedingungen zu kontrollieren.

In diesem Thema werden diese Optionen beschrieben.

Ändern der vom Modell verwendeten Daten

Die Entscheidungen, die Sie treffen, welche Datenspalten im Modell verwendet werden sollen, und wie sie diese Daten verwenden und verarbeiten, wirken sich erheblich auf die Ergebnisse der Analyse aus. Die folgenden Themen enthalten Informationen, die Ihnen helfen, diese Auswahlmöglichkeiten zu verstehen.

Verwendung der Merkmalauswahl

Die meisten Data Mining-Algorithmen in Analysis Services verwenden einen Prozess namens Featureauswahl , um nur die nützlichsten Attribute für die Ergänzung zu einem Modell auszuwählen. Das Reduzieren der Anzahl von Spalten und Attributen kann die Leistung und die Qualität des Modells verbessern. Die verfügbaren Featureauswahlmethoden unterscheiden sich je nach ausgewähltem Algorithmus.

Featureauswahl (Datenanalyse)

Ändern der Nutzung

Sie können ändern, welche Spalten in einem Miningmodell enthalten sind und wie jede Spalte verwendet wird. Wenn Sie die erwarteten Ergebnisse nicht erhalten, sollten Sie die Spalten, die Sie als Eingabe verwendet haben, beispielen und sich fragen, ob die Spalten eine gute Wahl sind und ob es alles gibt, was Sie tun können, um die Verarbeitung von Daten zu verbessern, einschließlich:

  • Identifizieren kategorisierter Variablen, die versehentlich als Zahlen bezeichnet wurden.

  • Hinzufügen von Kategorien zum Reduzieren der Anzahl von Attributen und vereinfachen das Auffinden von Korrelationen.

  • Ändern der Art und Weise, wie Zahlen binniert oder diskretiert werden.

  • Entfernen von Spalten mit einer Vielzahl eindeutiger Werte oder Spalten, die wirklich auf Daten verweisen und nicht für die Analyse nützlich sind, z. B. Adressen oder Mittlere Namen.

Sie müssen spalten nicht physisch aus der Bergbaustruktur entfernen. Sie können die Spalte einfach als "Ignorieren" kennzeichnen. Die Spalte wird aus dem Miningmodell entfernt, kann aber weiterhin von anderen Miningmodellen in der Struktur verwendet werden oder in einer Drillthrough-Abfrage referenziert werden.

Erstellen von Aliasen für Modellspalten

Wenn Analysis Services das Miningmodell erstellt, verwendet es die gleichen Spaltennamen, die in der Miningstruktur sind. Sie können einer beliebigen Spalte im Miningmodell einen Alias hinzufügen. Es kann das Verständnis des Spalteninhalts oder seiner Verwendung erleichtern oder den Namen für eine einfachere Erstellung von Abfragen verkürzen. Aliase sind auch hilfreich, wenn Sie eine Kopie einer Spalte erstellen und ihr einen beschreibenden Namen geben möchten.

Sie erstellen einen Alias, indem Sie die Name-Eigenschaft der Mining-Modellspalte bearbeiten. Analysis Services verwendet weiterhin den ursprünglichen Namen als ID der Spalte, und der neue Wert, für den Sie eingeben Name , wird zum Spaltenalias und wird im Raster neben der Spaltenverwendung in Klammern angezeigt.

Aliase für Miningmodellspalten

Die Grafik zeigt verwandte Modelle mit mehreren Kopien einer Miningstrukturspalte, die alle im Zusammenhang mit Einkommen stehen. Jede Kopie der Strukturspalte wurde auf eine andere Weise diskretisiert. Die Modelle im Diagramm verwenden jeweils eine andere Spalte als die Bergbaustruktur; Aus Gründen der Einfachheit beim Vergleichen der Spalten über die Modelle wurde die Spalte in jedem Modell jedoch in [Einkommen] umbenannt.

Hinzufügen von Filtern

Sie können einem Miningmodell einen Filter hinzufügen. Ein Filter ist eine Reihe von WHERE-Bedingungen, die die Daten in den Modellfällen auf eine Teilmenge beschränken. Der Filter wird beim Trainieren des Modells verwendet und kann optional verwendet werden, wenn Sie das Modell testen oder Genauigkeitsdiagramme erstellen.

Durch das Hinzufügen von Filtern können Sie Miningstrukturen wiederverwenden, aber Modelle basierend auf sehr unterschiedlichen Teilmengen der Daten erstellen. Oder Sie können einfach Filter verwenden, um bestimmte Zeilen zu beseitigen und die Qualität der Analyse zu verbessern.

Weitere Informationen finden Sie unter Filter für Miningmodelle (Analysis Services – Data Mining).

Ändern des Algorithmus

Obwohl neue Modelle, die Sie einer Miningstruktur hinzufügen, denselben Datensatz gemeinsam nutzen, können Sie unterschiedliche Ergebnisse mithilfe eines anderen Algorithmus (sofern die Daten dies unterstützen) oder durch Ändern der Parameter für den Algorithmus erhalten. Sie können auch Modellierungskennzeichnungen festlegen.

Die Auswahl des Algorithmus bestimmt, welche Art von Ergebnissen Sie erhalten. Allgemeine Informationen dazu, wie ein bestimmter Algorithmus funktioniert, oder die Geschäftsszenarien, in denen Sie von der Verwendung eines bestimmten Algorithmus profitieren würden, finden Sie unter Data Mining-Algorithmen (Analysis Services – Data Mining).

Im technischen Referenzthema für jeden Algorithmus finden Sie eine Beschreibung der Anforderungen und Einschränkungen sowie detaillierte Informationen zu den Anpassungen, die jeder Algorithmus unterstützt.

Microsoft Decision Trees-Algorithmus Microsoft-Zeitreihenalgorithmus
Microsoft Clustering-Algorithmus Microsoft Neural Network Algorithm
Microsoft Naive Bayes-Algorithmus Microsoft Logistic Regression Algorithm
Microsoft Association Algorithm Microsoft Linear Regressionsalgorithmus
Microsoft Sequence Clustering Algorithm

Anpassen von Algorithmusparametern

Jeder Algorithmus unterstützt Parameter, mit denen Sie das Verhalten des Algorithmus anpassen und die Ergebnisse Ihres Modells optimieren können. Eine Beschreibung der Verwendung der einzelnen Parameter finden Sie in den folgenden Themen:

Das Thema für jeden Algorithmustyp listet auch die Vorhersagefunktionen auf, die mit Modellen basierend auf diesem Algorithmus verwendet werden können.

Eigenschaftsname Gilt für:
Automatische Erkennung der Periodizität Technische Referenz zu Microsoft-Zeitreihenalgorithmus
Clusteranzahl Technische Referenz zum Microsoft Clustering-Algorithmus

Technische Referenz zu Microsoft Sequence Clustering Algorithm
Cluster-Saatgut Technische Referenz zum Microsoft Clustering-Algorithmus
KLUSTERIERUNGSMETHODE Technische Referenz zum Microsoft Clustering-Algorithmus
Komplexitätsstrafe Technische Referenz zum Microsoft Decision Trees-Algorithmus

Technische Referenz zu Microsoft-Zeitreihenalgorithmus
FORCE_REGRESSOR Technische Referenz zum Microsoft Decision Trees-Algorithmus

Technische Referenz zum Microsoft Linear Regressionsalgorithmus

Modellieren von Flags (Data Mining)
Prognosemethode Technische Referenz zu Microsoft-Zeitreihenalgorithmus
HIDDEN_NODE_RATIO (Verhältnis versteckter Knoten) Technische Referenz zum Microsoft Neural Network Algorithm
HISTORIC_MODEL_COUNT Technische Referenz zu Microsoft-Zeitreihenalgorithmus
Modellhistorische Lücke Technische Referenz zu Microsoft-Zeitreihenalgorithmus
Zurückbehaltensprozentsatz Technische Referenz zum Microsoft Logistics Regressionsalgorithmus

Technische Referenz zum Microsoft Neural Network Algorithm

Hinweis: Dieser Parameter unterscheidet sich von dem Holdout-Prozentsatz, der auf eine Miningstruktur angewendet wird.
HOLDOUT_SEED Technische Referenz zum Microsoft Logistics Regressionsalgorithmus

Technische Referenz zum Microsoft Neural Network Algorithm

Hinweis: Dieser Parameter unterscheidet sich vom Haltewert des Seedwerts, der für eine Miningstruktur gilt.
INSTABILITÄT_SEMPFINDLICHKEIT Technische Referenz zu Microsoft-Zeitreihenalgorithmus
MAXIMALE_EINGABEEIGENSCHAFTEN Technische Referenz zum Microsoft Clustering-Algorithmus

Technische Referenz zum Microsoft Decision Trees-Algorithmus

Technische Referenz zum Microsoft Linear Regressionsalgorithmus

Technische Referenz zum Microsoft Naive Bayes-Algorithmus

Technische Referenz zum Microsoft Neural Network Algorithm

Technische Referenz zum Microsoft Logistics Regressionsalgorithmus
MAXIMALE_ELEMENTSET_ANZAHL Technische Referenz zu Microsoft Association Algorithm
MAXIMALE_ELEMENTMENGE_GRÖSSE Technische Referenz zu Microsoft Association Algorithm
MAXIMALE_AUSGABEMERKMALE Technische Referenz zum Microsoft Decision Trees-Algorithmus

Technische Referenz zum Microsoft Linear Regressionsalgorithmus

Technische Referenz zum Microsoft Logistics Regressionsalgorithmus

Technische Referenz zum Microsoft Naive Bayes-Algorithmus

Technische Referenz zum Microsoft Neural Network Algorithm
MAXIMALE_SEQUENCE_ZUSTÄNDE Technische Referenz zu Microsoft Sequence Clustering Algorithm
MAXIMUM_SERIENWERT Technische Referenz zu Microsoft-Zeitreihenalgorithmus
MAXIMALE_ZUSTÄNDE Technische Referenz zum Microsoft Clustering-Algorithmus

Technische Referenz zum Microsoft Neural Network Algorithm

Technische Referenz zu Microsoft Sequence Clustering Algorithm
Maximale Unterstützung Technische Referenz zu Microsoft Association Algorithm
MINIMALE WICHTIGKEIT Technische Referenz zu Microsoft Association Algorithm
MINIMUM_ITEMSET_GRÖSSE Technische Referenz zu Microsoft Association Algorithm
MINIMUM ABHÄNGIGKEITSWAHRSCHEINLICHKEIT Technische Referenz zum Microsoft Naive Bayes-Algorithmus
Mindestwahrscheinlichkeit Technische Referenz zu Microsoft Association Algorithm
MINDESTWERT_SERIE Technische Referenz zu Microsoft-Zeitreihenalgorithmus
MINDESTUNTERSTÜTZUNG Technische Referenz zu Microsoft Association Algorithm

Technische Referenz zum Microsoft Clustering-Algorithmus

Technische Referenz zum Microsoft Decision Trees-Algorithmus

Technische Referenz zu Microsoft Sequence Clustering Algorithm

Technische Referenz zu Microsoft-Zeitreihenalgorithmus
MISSING_VALUE_SUBSTITUTION Technische Referenz zu Microsoft-Zeitreihenalgorithmus
Modellierung_Kardinalität Technische Referenz zum Microsoft Clustering-Algorithmus
PERIODIZITÄTS_HINWEIS Technische Referenz zu Microsoft-Zeitreihenalgorithmus
PREDICTION_SMOOTHING Technische Referenz zu Microsoft-Zeitreihenalgorithmus
Stichprobengröße Technische Referenz zum Microsoft Clustering-Algorithmus

Technische Referenz zum Microsoft Logistics Regressionsalgorithmus

Technische Referenz zum Microsoft Neural Network Algorithm
SCORE_METHOD Technische Referenz zum Microsoft Decision Trees-Algorithmus
SPLIT_METHOD Technische Referenz zum Microsoft Decision Trees-Algorithmus
STOPPTOLERANZ Technische Referenz zum Microsoft Clustering-Algorithmus

Siehe auch

Data Mining-Algorithmen (Analysis Services - Data Mining)Physische Architektur (Analysis Services - Data Mining)