Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Nachdem Sie einen Algorithmus ausgewählt haben, der Ihren Geschäftlichen Anforderungen entspricht, können Sie das Miningmodell auf folgende Weise anpassen, um die Ergebnisse potenziell zu verbessern.
Verwenden Sie unterschiedliche Datenspalten im Modell, oder ändern Sie die Verwendungs-, Inhaltstyp- oder Diskretisierungsmethode für die Spalten.
Erstellen Sie Filter für das Miningmodell, um die in der Schulung des Modells verwendeten Daten einzuschränken.
Ändern Sie den Algorithmus, der zum Analysieren von Daten verwendet wurde.
Legen Sie Algorithmusparameter fest, um Schwellenwerte, Baumteilungen und andere wichtige Bedingungen zu kontrollieren.
In diesem Thema werden diese Optionen beschrieben.
Ändern der vom Modell verwendeten Daten
Die Entscheidungen, die Sie treffen, welche Datenspalten im Modell verwendet werden sollen, und wie sie diese Daten verwenden und verarbeiten, wirken sich erheblich auf die Ergebnisse der Analyse aus. Die folgenden Themen enthalten Informationen, die Ihnen helfen, diese Auswahlmöglichkeiten zu verstehen.
Verwendung der Merkmalauswahl
Die meisten Data Mining-Algorithmen in Analysis Services verwenden einen Prozess namens Featureauswahl , um nur die nützlichsten Attribute für die Ergänzung zu einem Modell auszuwählen. Das Reduzieren der Anzahl von Spalten und Attributen kann die Leistung und die Qualität des Modells verbessern. Die verfügbaren Featureauswahlmethoden unterscheiden sich je nach ausgewähltem Algorithmus.
Ändern der Nutzung
Sie können ändern, welche Spalten in einem Miningmodell enthalten sind und wie jede Spalte verwendet wird. Wenn Sie die erwarteten Ergebnisse nicht erhalten, sollten Sie die Spalten, die Sie als Eingabe verwendet haben, beispielen und sich fragen, ob die Spalten eine gute Wahl sind und ob es alles gibt, was Sie tun können, um die Verarbeitung von Daten zu verbessern, einschließlich:
Identifizieren kategorisierter Variablen, die versehentlich als Zahlen bezeichnet wurden.
Hinzufügen von Kategorien zum Reduzieren der Anzahl von Attributen und vereinfachen das Auffinden von Korrelationen.
Ändern der Art und Weise, wie Zahlen binniert oder diskretiert werden.
Entfernen von Spalten mit einer Vielzahl eindeutiger Werte oder Spalten, die wirklich auf Daten verweisen und nicht für die Analyse nützlich sind, z. B. Adressen oder Mittlere Namen.
Sie müssen spalten nicht physisch aus der Bergbaustruktur entfernen. Sie können die Spalte einfach als "Ignorieren" kennzeichnen. Die Spalte wird aus dem Miningmodell entfernt, kann aber weiterhin von anderen Miningmodellen in der Struktur verwendet werden oder in einer Drillthrough-Abfrage referenziert werden.
Erstellen von Aliasen für Modellspalten
Wenn Analysis Services das Miningmodell erstellt, verwendet es die gleichen Spaltennamen, die in der Miningstruktur sind. Sie können einer beliebigen Spalte im Miningmodell einen Alias hinzufügen. Es kann das Verständnis des Spalteninhalts oder seiner Verwendung erleichtern oder den Namen für eine einfachere Erstellung von Abfragen verkürzen. Aliase sind auch hilfreich, wenn Sie eine Kopie einer Spalte erstellen und ihr einen beschreibenden Namen geben möchten.
Sie erstellen einen Alias, indem Sie die Name-Eigenschaft der Mining-Modellspalte bearbeiten. Analysis Services verwendet weiterhin den ursprünglichen Namen als ID der Spalte, und der neue Wert, für den Sie eingeben Name , wird zum Spaltenalias und wird im Raster neben der Spaltenverwendung in Klammern angezeigt.
Die Grafik zeigt verwandte Modelle mit mehreren Kopien einer Miningstrukturspalte, die alle im Zusammenhang mit Einkommen stehen. Jede Kopie der Strukturspalte wurde auf eine andere Weise diskretisiert. Die Modelle im Diagramm verwenden jeweils eine andere Spalte als die Bergbaustruktur; Aus Gründen der Einfachheit beim Vergleichen der Spalten über die Modelle wurde die Spalte in jedem Modell jedoch in [Einkommen] umbenannt.
Hinzufügen von Filtern
Sie können einem Miningmodell einen Filter hinzufügen. Ein Filter ist eine Reihe von WHERE-Bedingungen, die die Daten in den Modellfällen auf eine Teilmenge beschränken. Der Filter wird beim Trainieren des Modells verwendet und kann optional verwendet werden, wenn Sie das Modell testen oder Genauigkeitsdiagramme erstellen.
Durch das Hinzufügen von Filtern können Sie Miningstrukturen wiederverwenden, aber Modelle basierend auf sehr unterschiedlichen Teilmengen der Daten erstellen. Oder Sie können einfach Filter verwenden, um bestimmte Zeilen zu beseitigen und die Qualität der Analyse zu verbessern.
Weitere Informationen finden Sie unter Filter für Miningmodelle (Analysis Services – Data Mining).
Ändern des Algorithmus
Obwohl neue Modelle, die Sie einer Miningstruktur hinzufügen, denselben Datensatz gemeinsam nutzen, können Sie unterschiedliche Ergebnisse mithilfe eines anderen Algorithmus (sofern die Daten dies unterstützen) oder durch Ändern der Parameter für den Algorithmus erhalten. Sie können auch Modellierungskennzeichnungen festlegen.
Die Auswahl des Algorithmus bestimmt, welche Art von Ergebnissen Sie erhalten. Allgemeine Informationen dazu, wie ein bestimmter Algorithmus funktioniert, oder die Geschäftsszenarien, in denen Sie von der Verwendung eines bestimmten Algorithmus profitieren würden, finden Sie unter Data Mining-Algorithmen (Analysis Services – Data Mining).
Im technischen Referenzthema für jeden Algorithmus finden Sie eine Beschreibung der Anforderungen und Einschränkungen sowie detaillierte Informationen zu den Anpassungen, die jeder Algorithmus unterstützt.
Anpassen von Algorithmusparametern
Jeder Algorithmus unterstützt Parameter, mit denen Sie das Verhalten des Algorithmus anpassen und die Ergebnisse Ihres Modells optimieren können. Eine Beschreibung der Verwendung der einzelnen Parameter finden Sie in den folgenden Themen:
Das Thema für jeden Algorithmustyp listet auch die Vorhersagefunktionen auf, die mit Modellen basierend auf diesem Algorithmus verwendet werden können.
Siehe auch
Data Mining-Algorithmen (Analysis Services - Data Mining)Physische Architektur (Analysis Services - Data Mining)