Freigeben über


Microsoft Assoziationsalgorithmus

Der Microsoft Association-Algorithmus ist ein Zuordnungsalgorithmus, der von Analysis Services bereitgestellt wird, der für Empfehlungsmodule nützlich ist. Ein Empfehlungsmodul empfiehlt Kunden Produkte basierend auf bereits gekauften Artikeln oder in denen sie ein Interesse angegeben haben. Der Microsoft Association-Algorithmus ist auch für die Marktkorbanalyse nützlich. Ein Beispiel für eine Marktkorbanalyse finden Sie in Lektion 3: Erstellen eines Market Basket Scenario (Intermediate Data Mining Tutorial) im Data Mining-Lernprogramm.

Zuordnungsmodelle basieren auf Datasets, die Bezeichner sowohl für einzelne Fälle als auch für die Elemente enthalten, die die Fälle enthalten. Eine Gruppe von Elementen in einem Fall wird als Itemset bezeichnet. Ein Zuordnungsmodell besteht aus einer Reihe von Itemsets und den Regeln, die beschreiben, wie diese Elemente innerhalb der Fälle gruppiert werden. Die Regeln, die der Algorithmus identifiziert, können verwendet werden, um die wahrscheinlichen zukünftigen Einkäufe eines Kunden basierend auf den Artikeln vorherzusagen, die bereits im Einkaufswagen des Kunden vorhanden sind. Das folgende Diagramm zeigt eine Reihe von Regeln in einem Itemset.

Eine Reihe von Regeln für ein Zuordnungsmodell

Wie das Diagramm zeigt, kann der Microsoft Association-Algorithmus möglicherweise viele Regeln innerhalb eines Datasets finden. Der Algorithmus verwendet zwei Parameter, Unterstützung und Wahrscheinlichkeit, um die von ihr generierten Itemsets und Regeln zu beschreiben. Wenn Z. B. X und Y zwei Elemente darstellen, die sich in einem Einkaufswagen befinden könnten, ist der Supportparameter die Anzahl der Fälle im Dataset, die die Kombination aus Elementen, X und Y enthalten. Mithilfe des Unterstützungsparameters in Kombination mit den benutzerdefinierten Parametern MINIMUM_SUPPORT und MAXIMUM_SUPPORT steuert der Algorithmus die Anzahl der generierten Itemsets. Der Wahrscheinlichkeitsparameter, auch als Konfidenz bezeichnet, stellt den Bruchteil der Fälle im Dataset dar, die X enthalten und auch Y enthalten. Mithilfe des Wahrscheinlichkeitsparameters in Kombination mit dem MINIMUM_PROBABILITY-Parameter steuert der Algorithmus die Anzahl der generierten Regeln.

Beispiel

Das Adventure Works Cycle-Unternehmen überarbeitet die Funktionalität seiner Website. Ziel der Neugestaltung ist es, den Absatz der Produkte zu steigern. Da das Unternehmen jeden Verkauf in einer Transaktionsdatenbank aufzeichnet, können sie den Microsoft Association-Algorithmus verwenden, um Gruppen von Produkten zu identifizieren, die tendenziell zusammen gekauft werden. Sie können dann zusätzliche Artikel vorhersagen, an denen ein Kunde interessiert sein könnte, basierend auf Elementen, die sich bereits im Einkaufskorb des Kunden befinden.

Funktionsweise des Algorithmus

Der Microsoft Association-Algorithmus durchläuft ein Dataset, um Elemente zu finden, die in einem Fall zusammen angezeigt werden. Der Algorithmus gruppiert dann in Itemsets alle zugeordneten Elemente, die mindestens in der Anzahl der Fälle angezeigt werden, die vom MINIMUM_SUPPORT-Parameter angegeben werden. Zum Beispiel könnte ein Itemset "Mountain 200=Existing, Sport 100=Existing" sein und einen Unterstützungswert von 710 haben. Der Algorithmus generiert dann Regeln aus den Itemsets. Diese Regeln werden verwendet, um das Vorhandensein eines Elements in der Datenbank zu prognostizieren, basierend auf dem Vorhandensein anderer spezifischer Elemente, die der Algorithmus als wichtig identifiziert. Beispielsweise könnte eine Regel "wenn Touring 1000=vorhanden und Road Flaschenhalter=vorhanden, dann Wasserspender=vorhanden" lauten und eine Wahrscheinlichkeit von 0,812 haben. In diesem Beispiel identifiziert der Algorithmus, dass das Vorhandensein im Korb des Touring 1000-Reifens und der Wasserflaschenkäfig voraussagt, dass eine Wasserflasche wahrscheinlich auch im Korb enthalten wäre.

Eine ausführlichere Erläuterung des Algorithmus zusammen mit einer Liste von Parametern zum Anpassen des Verhaltens des Algorithmus und zur Steuerung der Ergebnisse im Miningmodell finden Sie in der technischen Referenz zu Microsoft Association Algorithm.

Für Zuordnungsmodelle erforderliche Daten

Wenn Sie Daten für die Verwendung in einem Zuordnungsregelnmodell vorbereiten, sollten Sie die Anforderungen für den jeweiligen Algorithmus verstehen, einschließlich der benötigten Daten und der Verwendung der Daten.

Die Anforderungen für ein Zuordnungsregelnmodell sind wie folgt:

  • Eine einzelne Schlüsselspalte Jedes Modell muss eine numerische oder Textspalte enthalten, die jeden Datensatz eindeutig identifiziert. Zusammengesetzte Schlüssel sind nicht zulässig.

  • Eine einzelne vorhersagbare Spalte Ein Zuordnungsmodell kann nur eine vorhersagbare Spalte aufweisen. In der Regel handelt es sich um die Schlüsselspalte der geschachtelten Tabelle, wie die Spalte, die die gekauften Produkte auflistet. Die Werte müssen diskret oder diskretisiert sein.

  • Eingabespalten . Die Eingabespalten müssen diskret sein. Die Eingabedaten für ein Zuordnungsmodell sind häufig in zwei Tabellen enthalten. Eine Tabelle kann beispielsweise Kundeninformationen enthalten, während eine andere Tabelle Kundenkäufe enthält. Sie können diese Daten mithilfe einer geschachtelten Tabelle in das Modell eingeben. Weitere Informationen zu geschachtelten Tabellen finden Sie unter "Geschachtelte Tabellen" (Analysis Services – Data Mining).

Ausführlichere Informationen zu den inhaltstypen und Datentypen, die für Zuordnungsmodelle unterstützt werden, finden Sie im Abschnitt "Anforderungen" des Technischen Verweises auf den Microsoft Association-Algorithmus.

Darstellung eines Zuordnungsmodells

Um das Modell zu erkunden, können Sie den Microsoft Association Viewer verwenden. Wenn Sie ein Zuordnungsmodell anzeigen, stellt Analysis Services die Korrelationen aus verschiedenen Blickwinkeln dar, sodass Sie die Beziehungen und Regeln, die in den Daten gefunden wurden, besser verstehen können. Der Bereich "Itemset " im Viewer bietet eine detaillierte Aufschlüsselung der am häufigsten verwendeten Kombinationen oder Itemsets. Im Bereich "Regeln " wird eine Liste der Regeln angezeigt, die aus den Daten generalisiert wurden, Berechnungen der Wahrscheinlichkeit hinzugefügt und die Regeln nach relativer Wichtigkeit bewertet. Mit dem Abhängigkeitsnetzwerk-Viewer können Sie visuell untersuchen, wie einzelne unterschiedliche Elemente verbunden sind. Weitere Informationen finden Sie unter Durchsuchen eines Modells mithilfe des Microsoft Cluster Viewers.

Wenn Sie weitere Details zu einem der Itemsets und Regeln erfahren möchten, können Sie das Modell im Microsoft Generic Content Tree Viewer durchsuchen. Der für das Modell gespeicherte Inhalt enthält die Unterstützung für jedes Itemset, eine Bewertung für jede Regel und andere Statistiken. Weitere Informationen finden Sie unter Miningmodellinhalt für Zuordnungsmodelle (Analysis Services – Data Mining).

Erstellen von Vorhersagen

Nachdem das Modell verarbeitet wurde, können Sie die Regeln und Itemsets verwenden, um Vorhersagen zu erstellen. In einem Zuordnungsmodell gibt eine Vorhersage an, welches Element aufgrund des Vorhandenseins des angegebenen Elements wahrscheinlich eintritt, und die Vorhersage kann z. B. Informationen wie Wahrscheinlichkeit, Unterstützung oder Wichtigkeit enthalten. Beispiele zum Erstellen von Abfragen für ein Zuordnungsmodell finden Sie unter "Beispiele für Zuordnungsmodellabfragen".

Allgemeine Informationen zum Erstellen einer Abfrage für ein Data Mining-Modell finden Sie unter Data Mining-Abfragen.

Leistung

Der Vorgang zum Erstellen von Itemsets und Zählkorrelationen kann zeitaufwändig sein. Obwohl der Microsoft Association Rules-Algorithmus Optimierungstechniken verwendet, um Platz zu sparen und die Verarbeitung schneller zu machen, sollten Sie wissen, dass Leistungsprobleme unter Bedingungen wie den folgenden auftreten können:

  • Der Datensatz ist groß mit vielen einzelnen Elementen.

  • Die Mindestgröße des Itemsets ist zu niedrig festgelegt.

Um die Verarbeitungszeit zu minimieren und die Komplexität der Itemsets zu verringern, können Sie versuchen, verwandte Elemente nach Kategorien zu gruppieren, bevor Sie die Daten analysieren.

Bemerkungen

  • Unterstützt nicht die Verwendung von Predictive Model Markup Language (PMML) zum Erstellen von Miningmodellen.

  • Unterstützt Drillthrough.

  • Unterstützt die Verwendung von OLAP-Miningmodellen.

  • Unterstützt die Erstellung von Data Mining-Dimensionen.

Siehe auch

Data Mining-Algorithmen (Analysis Services - Data Mining)Durchsuchen eines Modells mithilfe des Microsoft Association Rules ViewerMining Model Content for Association Models (Analysis Services - Data Mining)Microsoft Association Algorithm Technical ReferenceAssociation Model Query Examples