Anpassen von Miningmodellen und -struktur

Nachdem Sie einen Algorithmus ausgewählt haben, der Ihren Geschäftlichen Anforderungen entspricht, können Sie das Miningmodell auf folgende Weise anpassen, um die Ergebnisse potenziell zu verbessern.

Verwenden Sie unterschiedliche Datenspalten im Modell, oder ändern Sie die Verwendungs-, Inhaltstyp- oder Diskretisierungsmethode für die Spalten.
Erstellen Sie Filter für das Miningmodell, um die in der Schulung des Modells verwendeten Daten einzuschränken.
Ändern Sie den Algorithmus, der zum Analysieren von Daten verwendet wurde.
Legen Sie Algorithmusparameter fest, um Schwellenwerte, Baumteilungen und andere wichtige Bedingungen zu kontrollieren.

In diesem Thema werden diese Optionen beschrieben.

Ändern der vom Modell verwendeten Daten

Die Entscheidungen, die Sie treffen, welche Datenspalten im Modell verwendet werden sollen, und wie sie diese Daten verwenden und verarbeiten, wirken sich erheblich auf die Ergebnisse der Analyse aus. Die folgenden Themen enthalten Informationen, die Ihnen helfen, diese Auswahlmöglichkeiten zu verstehen.

Verwendung der Merkmalauswahl

Die meisten Data Mining-Algorithmen in Analysis Services verwenden einen Prozess namens Featureauswahl , um nur die nützlichsten Attribute für die Ergänzung zu einem Modell auszuwählen. Das Reduzieren der Anzahl von Spalten und Attributen kann die Leistung und die Qualität des Modells verbessern. Die verfügbaren Featureauswahlmethoden unterscheiden sich je nach ausgewähltem Algorithmus.

Featureauswahl (Datenanalyse)

Ändern der Nutzung

Sie können ändern, welche Spalten in einem Miningmodell enthalten sind und wie jede Spalte verwendet wird. Wenn Sie die erwarteten Ergebnisse nicht erhalten, sollten Sie die Spalten, die Sie als Eingabe verwendet haben, beispielen und sich fragen, ob die Spalten eine gute Wahl sind und ob es alles gibt, was Sie tun können, um die Verarbeitung von Daten zu verbessern, einschließlich:

Identifizieren kategorisierter Variablen, die versehentlich als Zahlen bezeichnet wurden.
Hinzufügen von Kategorien zum Reduzieren der Anzahl von Attributen und vereinfachen das Auffinden von Korrelationen.
Ändern der Art und Weise, wie Zahlen binniert oder diskretiert werden.
Entfernen von Spalten mit einer Vielzahl eindeutiger Werte oder Spalten, die wirklich auf Daten verweisen und nicht für die Analyse nützlich sind, z. B. Adressen oder Mittlere Namen.

Sie müssen spalten nicht physisch aus der Bergbaustruktur entfernen. Sie können die Spalte einfach als "Ignorieren" kennzeichnen. Die Spalte wird aus dem Miningmodell entfernt, kann aber weiterhin von anderen Miningmodellen in der Struktur verwendet werden oder in einer Drillthrough-Abfrage referenziert werden.

Erstellen von Aliasen für Modellspalten

Wenn Analysis Services das Miningmodell erstellt, verwendet es die gleichen Spaltennamen, die in der Miningstruktur sind. Sie können einer beliebigen Spalte im Miningmodell einen Alias hinzufügen. Es kann das Verständnis des Spalteninhalts oder seiner Verwendung erleichtern oder den Namen für eine einfachere Erstellung von Abfragen verkürzen. Aliase sind auch hilfreich, wenn Sie eine Kopie einer Spalte erstellen und ihr einen beschreibenden Namen geben möchten.

Sie erstellen einen Alias, indem Sie die Name-Eigenschaft der Mining-Modellspalte bearbeiten. Analysis Services verwendet weiterhin den ursprünglichen Namen als ID der Spalte, und der neue Wert, für den Sie eingeben Name , wird zum Spaltenalias und wird im Raster neben der Spaltenverwendung in Klammern angezeigt.

Aliase für Miningmodellspalten

Die Grafik zeigt verwandte Modelle mit mehreren Kopien einer Miningstrukturspalte, die alle im Zusammenhang mit Einkommen stehen. Jede Kopie der Strukturspalte wurde auf eine andere Weise diskretisiert. Die Modelle im Diagramm verwenden jeweils eine andere Spalte als die Bergbaustruktur; Aus Gründen der Einfachheit beim Vergleichen der Spalten über die Modelle wurde die Spalte in jedem Modell jedoch in [Einkommen] umbenannt.

Hinzufügen von Filtern

Sie können einem Miningmodell einen Filter hinzufügen. Ein Filter ist eine Reihe von WHERE-Bedingungen, die die Daten in den Modellfällen auf eine Teilmenge beschränken. Der Filter wird beim Trainieren des Modells verwendet und kann optional verwendet werden, wenn Sie das Modell testen oder Genauigkeitsdiagramme erstellen.

Durch das Hinzufügen von Filtern können Sie Miningstrukturen wiederverwenden, aber Modelle basierend auf sehr unterschiedlichen Teilmengen der Daten erstellen. Oder Sie können einfach Filter verwenden, um bestimmte Zeilen zu beseitigen und die Qualität der Analyse zu verbessern.

Weitere Informationen finden Sie unter Filter für Miningmodelle (Analysis Services – Data Mining).

Ändern des Algorithmus

Obwohl neue Modelle, die Sie einer Miningstruktur hinzufügen, denselben Datensatz gemeinsam nutzen, können Sie unterschiedliche Ergebnisse mithilfe eines anderen Algorithmus (sofern die Daten dies unterstützen) oder durch Ändern der Parameter für den Algorithmus erhalten. Sie können auch Modellierungskennzeichnungen festlegen.

Die Auswahl des Algorithmus bestimmt, welche Art von Ergebnissen Sie erhalten. Allgemeine Informationen dazu, wie ein bestimmter Algorithmus funktioniert, oder die Geschäftsszenarien, in denen Sie von der Verwendung eines bestimmten Algorithmus profitieren würden, finden Sie unter Data Mining-Algorithmen (Analysis Services – Data Mining).

Im technischen Referenzthema für jeden Algorithmus finden Sie eine Beschreibung der Anforderungen und Einschränkungen sowie detaillierte Informationen zu den Anpassungen, die jeder Algorithmus unterstützt.


Microsoft Decision Trees-Algorithmus	Microsoft-Zeitreihenalgorithmus
Microsoft Clustering-Algorithmus	Microsoft Neural Network Algorithm
Microsoft Naive Bayes-Algorithmus	Microsoft Logistic Regression Algorithm
Microsoft Association Algorithm	Microsoft Linear Regressionsalgorithmus
Microsoft Sequence Clustering Algorithm

Anpassen von Algorithmusparametern

Jeder Algorithmus unterstützt Parameter, mit denen Sie das Verhalten des Algorithmus anpassen und die Ergebnisse Ihres Modells optimieren können. Eine Beschreibung der Verwendung der einzelnen Parameter finden Sie in den folgenden Themen:

Das Thema für jeden Algorithmustyp listet auch die Vorhersagefunktionen auf, die mit Modellen basierend auf diesem Algorithmus verwendet werden können.

Eigenschaftsname	Gilt für:
Automatische Erkennung der Periodizität	Technische Referenz zu Microsoft-Zeitreihenalgorithmus
Clusteranzahl	Technische Referenz zum Microsoft Clustering-Algorithmus Technische Referenz zu Microsoft Sequence Clustering Algorithm
Cluster-Saatgut	Technische Referenz zum Microsoft Clustering-Algorithmus
KLUSTERIERUNGSMETHODE	Technische Referenz zum Microsoft Clustering-Algorithmus
Komplexitätsstrafe	Technische Referenz zum Microsoft Decision Trees-Algorithmus Technische Referenz zu Microsoft-Zeitreihenalgorithmus
FORCE_REGRESSOR	Technische Referenz zum Microsoft Decision Trees-Algorithmus Technische Referenz zum Microsoft Linear Regressionsalgorithmus Modellieren von Flags (Data Mining)
Prognosemethode	Technische Referenz zu Microsoft-Zeitreihenalgorithmus
HIDDEN_NODE_RATIO (Verhältnis versteckter Knoten)	Technische Referenz zum Microsoft Neural Network Algorithm
HISTORIC_MODEL_COUNT	Technische Referenz zu Microsoft-Zeitreihenalgorithmus
Modellhistorische Lücke	Technische Referenz zu Microsoft-Zeitreihenalgorithmus
Zurückbehaltensprozentsatz	Technische Referenz zum Microsoft Logistics Regressionsalgorithmus Technische Referenz zum Microsoft Neural Network Algorithm Hinweis: Dieser Parameter unterscheidet sich von dem Holdout-Prozentsatz, der auf eine Miningstruktur angewendet wird.
HOLDOUT_SEED	Technische Referenz zum Microsoft Logistics Regressionsalgorithmus Technische Referenz zum Microsoft Neural Network Algorithm Hinweis: Dieser Parameter unterscheidet sich vom Haltewert des Seedwerts, der für eine Miningstruktur gilt.
INSTABILITÄT_SEMPFINDLICHKEIT	Technische Referenz zu Microsoft-Zeitreihenalgorithmus
MAXIMALE_EINGABEEIGENSCHAFTEN	Technische Referenz zum Microsoft Clustering-Algorithmus Technische Referenz zum Microsoft Decision Trees-Algorithmus Technische Referenz zum Microsoft Linear Regressionsalgorithmus Technische Referenz zum Microsoft Naive Bayes-Algorithmus Technische Referenz zum Microsoft Neural Network Algorithm Technische Referenz zum Microsoft Logistics Regressionsalgorithmus
MAXIMALE_ELEMENTSET_ANZAHL	Technische Referenz zu Microsoft Association Algorithm
MAXIMALE_ELEMENTMENGE_GRÖSSE	Technische Referenz zu Microsoft Association Algorithm
MAXIMALE_AUSGABEMERKMALE	Technische Referenz zum Microsoft Decision Trees-Algorithmus Technische Referenz zum Microsoft Linear Regressionsalgorithmus Technische Referenz zum Microsoft Logistics Regressionsalgorithmus Technische Referenz zum Microsoft Naive Bayes-Algorithmus Technische Referenz zum Microsoft Neural Network Algorithm
MAXIMALE_SEQUENCE_ZUSTÄNDE	Technische Referenz zu Microsoft Sequence Clustering Algorithm
MAXIMUM_SERIENWERT	Technische Referenz zu Microsoft-Zeitreihenalgorithmus
MAXIMALE_ZUSTÄNDE	Technische Referenz zum Microsoft Clustering-Algorithmus Technische Referenz zum Microsoft Neural Network Algorithm Technische Referenz zu Microsoft Sequence Clustering Algorithm
Maximale Unterstützung	Technische Referenz zu Microsoft Association Algorithm
MINIMALE WICHTIGKEIT	Technische Referenz zu Microsoft Association Algorithm
MINIMUM_ITEMSET_GRÖSSE	Technische Referenz zu Microsoft Association Algorithm
MINIMUM ABHÄNGIGKEITSWAHRSCHEINLICHKEIT	Technische Referenz zum Microsoft Naive Bayes-Algorithmus
Mindestwahrscheinlichkeit	Technische Referenz zu Microsoft Association Algorithm
MINDESTWERT_SERIE	Technische Referenz zu Microsoft-Zeitreihenalgorithmus
MINDESTUNTERSTÜTZUNG	Technische Referenz zu Microsoft Association Algorithm Technische Referenz zum Microsoft Clustering-Algorithmus Technische Referenz zum Microsoft Decision Trees-Algorithmus Technische Referenz zu Microsoft Sequence Clustering Algorithm Technische Referenz zu Microsoft-Zeitreihenalgorithmus
MISSING_VALUE_SUBSTITUTION	Technische Referenz zu Microsoft-Zeitreihenalgorithmus
Modellierung_Kardinalität	Technische Referenz zum Microsoft Clustering-Algorithmus
PERIODIZITÄTS_HINWEIS	Technische Referenz zu Microsoft-Zeitreihenalgorithmus
PREDICTION_SMOOTHING	Technische Referenz zu Microsoft-Zeitreihenalgorithmus
Stichprobengröße	Technische Referenz zum Microsoft Clustering-Algorithmus Technische Referenz zum Microsoft Logistics Regressionsalgorithmus Technische Referenz zum Microsoft Neural Network Algorithm
SCORE_METHOD	Technische Referenz zum Microsoft Decision Trees-Algorithmus
SPLIT_METHOD	Technische Referenz zum Microsoft Decision Trees-Algorithmus
STOPPTOLERANZ	Technische Referenz zum Microsoft Clustering-Algorithmus

Siehe auch

Data Mining-Algorithmen (Analysis Services - Data Mining)Physische Architektur (Analysis Services - Data Mining)

Last updated on 2017-03-06

Freigeben über