Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
In diesem Thema werden einige technische Überlegungen beschrieben, die sie beim Verarbeiten von Data Mining-Objekten berücksichtigen sollten. Eine allgemeine Erläuterung der Verarbeitung und deren Anwendung auf Data Mining finden Sie unter Verarbeiten von Data Mining-Objekten.
Abfragen im relationalen Speicher
Verarbeitung von Bergbaustrukturen
Verarbeitung von Miningmodellen
Abfragen im relationalen Speicher während der Verarbeitung
Für data Mining gibt es drei Phasen zur Verarbeitung: Abfragen der Quelldaten, Ermitteln von Rohstatistiken und Verwenden der Modelldefinition und des Algorithmus zum Trainieren des Miningmodells.
Der Analysis Services-Server gibt Abfragen an die Datenbank aus, die die Rohdaten bereitstellt. Diese Datenbank kann eine Instanz von SQL Server 2014 oder eine frühere Version des SQL Server-Datenbankmoduls sein. Wenn Sie eine Data Mining-Struktur verarbeiten, werden die Daten in der Quelle in die Miningstruktur übertragen und auf dem Datenträger in einem neuen komprimierten Format gespeichert. Nicht jede Spalte in der Datenquelle wird verarbeitet: nur die Spalten, die in der Miningstruktur enthalten sind, wie durch die Bindungen definiert.
Mithilfe dieser Daten erstellt Analysis Services einen Index aller Daten und diskretisierten Spalten und erstellt einen separaten Index für fortlaufende Spalten. Eine Abfrage wird für jede geschachtelte Tabelle ausgegeben, um den Index zu erstellen, und eine zusätzliche Abfrage pro geschachtelter Tabelle wird generiert, um Beziehungen zwischen den einzelnen Paaren einer geschachtelten Tabelle und Falltabelle zu verarbeiten. Der Grund für das Erstellen mehrerer Abfragen besteht darin, einen speziellen internen multidimensionalen Datenspeicher zu verarbeiten. Sie können die Anzahl der Abfragen einschränken, die Analysis Services an den relationalen Speicher sendet, indem Sie die Servereigenschaft festlegen. DatabaseConnectionPoolMax Weitere Informationen finden Sie unter OLAP-Eigenschaften.
Wenn Sie das Modell verarbeiten, werden die Daten nicht aus der Datenquelle neu gelesen, sondern stattdessen die Zusammenfassung der Daten aus der Miningstruktur abgerufen. Mithilfe des erstellten Cubes und der zwischengespeicherten Index- und Falldaten erstellt der Server unabhängige Threads, um die Modelle zu trainieren.
Weitere Informationen zu den Editionen von SQL Server, die parallele Modellverarbeitung unterstützen, finden Sie unter Features, die von den Editionen von SQL Server 2012 (https://go.microsoft.com/fwlink/?linkid=232473) unterstützt werden.
Verarbeitung von Bergbaustrukturen
Eine Bergbaustruktur kann zusammen mit allen abhängigen Modellen oder separat verarbeitet werden. Die separate Verarbeitung einer Miningstruktur von Modellen kann nützlich sein, wenn einige Modelle eine lange Zeit zu verarbeiten benötigen und Sie diesen Vorgang zurückstellen möchten.
Weitere Informationen finden Sie unter "Process a Mining Structure".
Wenn Sie besorgt sind, Festplattenspeicher zu sparen, beachten Sie, dass Analysis Services die Caches der Miningstruktur lokal speichert. Das heißt, es schreibt alle Schulungsdaten auf Ihre lokale Festplatte aus. Wenn die Daten nicht zwischengespeichert werden sollen, können Sie die Standardeinstellung ändern, indem Sie die Eigenschaft MiningStructureCacheMode für die Miningstruktur auf ClearAfterProcessing festlegen. Dadurch wird der Cache gelöscht, nachdem Modelle verarbeitet wurden; es wird jedoch auch Drillthrough für die Miningstruktur deaktiviert. Weitere Informationen finden Sie unter Drillthrough Queries (Data Mining).
Wenn Sie den Cache löschen, können Sie den Holdout-Testsatz nicht verwenden, wenn Sie einen definiert haben, und die Definition der Testsatzpartition geht verloren. Weitere Informationen zu Holdout-Datasets finden Sie unter Schulungs- und Testdatensätze.
Verarbeiten von Miningmodellen
Sie können ein Miningmodell separat von der zugeordneten Bergbaustruktur verarbeiten, oder Sie können alle Modelle verarbeiten, die auf der Struktur basieren, zusammen mit der Struktur.
Weitere Informationen finden Sie unter Process a Mining Model.
Allerdings kann man in SQL Server Data Tools (SSDT) und SQL Server Management Studio nicht mehrere Mining-Modelle gleichzeitig zur Verarbeitung mit der Struktur auswählen. Wenn Sie steuern müssen, welche Modelle verarbeitet werden, müssen Sie sie entweder einzeln auswählen oder XMLA oder DMX verwenden, um Modelle seriell zu verarbeiten.
Wenn die Erneute Verarbeitung erforderlich ist
Sie müssen die von Ihnen definierten Analysis Services-Modelle verarbeiten, bevor Sie mit der Arbeit damit beginnen können. Sie müssen die Miningmodelle auch neu verarbeiten, wenn Sie die Miningmodellstruktur ändern, die Schulungsdaten aktualisieren, ein vorhandenes Miningmodell ändern oder der Struktur ein neues Miningmodell hinzufügen.
Miningmodelle werden auch in diesen Szenarien verarbeitet:
Bereitstellung eines Projekts: Abhängig von den Projekteinstellungen und dem aktuellen Status des Projekts werden die Miningmodelle im Projekt in der Regel vollständig verarbeitet, wenn das Projekt bereitgestellt wird.
Wenn Sie die Bereitstellung initiieren, wird die Verarbeitung automatisch gestartet, es sei denn, es gibt eine zuvor verarbeitete Version auf dem Analysis Services-Server, und es wurden keine strukturellen Änderungen vorgenommen. Sie können ein Projekt bereitstellen, indem Sie in der Dropdownliste die Option "Lösung bereitstellen " auswählen oder F5 drücken. Sie können
Weitere Informationen zum Festlegen von Analysis Services-Bereitstellungseigenschaften, die steuern, wie Miningmodelle bereitgestellt werden, finden Sie unter Deployment of Data Mining Solutions.
Verschieben eines Miningmodells: Wenn Sie ein Miningmodell mithilfe des Befehls EXPORT verschieben, wird nur die Definition des Modells exportiert, die den Namen der Miningstruktur enthält, die erwartet wird, dass daten für das Modell bereitgestellt werden.
Anforderungen für die Neuverarbeitung für die folgenden Szenarien mit den Befehlen EXPORT und IMPORT:
Die Miningstruktur ist in der Zielinstanz vorhanden, und die Miningstruktur befindet sich in einem nicht verarbeiteten Zustand.
Sowohl die Struktur als auch das Modell müssen neu verarbeitet werden.
Die Miningstruktur ist in der Zielinstanz vorhanden und wurde verarbeitet. Nur das Miningmodell wurde exportiert.
Das Modell kann ohne Verarbeitung verwendet werden.
Die Miningstrukturdefinition wurde auch mithilfe des SCHLÜSSELworts WITH DEENDENCIES exportiert.
Sowohl die Struktur als auch das Modell müssen neu verarbeitet werden.
Weitere Informationen finden Sie unter Exportieren und Importieren von Data Mining-Objekten.
Siehe auch
Miningstrukturen (Analysis Services - Data Mining)
Miningstrukturen (Analysis Services - Data Mining)
Verarbeitung von Objekten im multidimensionalen Modell