Freigeben über


Was ist die Speicherstruktur für analytische Datenflüsse?

Analytische Datenflüsse speichern sowohl Daten als auch Metadaten in Azure Data Lake Storage. Dataflows verwenden eine Standardstruktur, um Im See erstellte Daten zu speichern und zu beschreiben, die als Allgemeine Datenmodellordner bezeichnet werden. In diesem Artikel erfahren Sie mehr über den Speicherstandard, den Dataflows hinter den Kulissen verwenden.

Speicher benötigt eine Struktur für einen analytischen Datenfluss.

Wenn der Datenfluss standard ist, werden die Daten in Dataverse gespeichert. Dataverse ist wie ein Datenbanksystem; es hat das Konzept von Tabellen, Ansichten usw. Dataverse ist eine strukturierte Datenspeicheroption, die von Standarddatenflüssen verwendet wird.

Wenn der Datenfluss jedoch analytisch ist, werden die Daten in Azure Data Lake Storage gespeichert. Die Daten und Metadaten eines Datenflusses werden in einem Gemeinsamen Datenmodellordner gespeichert. Da ein Speicherkonto möglicherweise mehrere Darin gespeicherte Datenflüsse enthält, wird eine Hierarchie von Ordnern und Unterordnern eingeführt, um die Daten zu organisieren. Je nach Produkt, in dem der Datenfluss erstellt wurde, können die Ordner und Unterordner Arbeitsbereiche (oder Umgebungen) und dann der Gemeinsame Datenmodellordner des Datenflusses darstellen. Innerhalb des Ordners "Common Data Model" werden sowohl Schema- als auch Daten der Datenflusstabellen gespeichert. Diese Struktur folgt den Standards, die für common Data Model definiert sind.

Diagramm eines analytischen Datenflusses, der die Daten in der Allgemeinen Datenmodellstruktur speichert.

Was ist die Speicherstruktur des allgemeinen Datenmodells?

Common Data Model ist eine Metadatenstruktur, die definiert ist, um Die Konformität und Konsistenz für die Verwendung von Daten auf mehreren Plattformen zu gewährleisten. Das allgemeine Datenmodell ist keine Datenspeicherung, es ist die Art und Weise, wie Daten gespeichert und definiert werden.

Allgemeine Datenmodellordner definieren, wie das Schema und die zugehörigen Daten einer Tabelle gespeichert werden sollen. In Azure Data Lake Storage werden Daten in Ordnern organisiert. Ordner können einen Arbeitsbereich oder eine Umgebung darstellen. Unter diesen Ordnern werden Unterordner für jeden Datenfluss erstellt.

Screenshot der Ordnerstruktur des Arbeitsbereichs.

Was befindet sich in einem Datenflussordner?

Jeder Datenflussordner enthält einen Unterordner für jede Tabelle und eine Metadatendatei mit dem Namen model.json.

Diagramm des Ordners

Die Metadatendatei: model.json

Die model.json Datei ist die Metadatendefinition des Datenflusses. Diese Datei ist die einzige Datei, die alle Datenflussmetadaten enthält. Sie enthält eine Liste von Tabellen, spalten und deren Datentypen in jeder Tabelle, die Beziehung zwischen Tabellen usw. Sie können diese Datei ganz einfach aus einem Datenfluss exportieren, auch wenn Sie keinen Zugriff auf die Ordnerstruktur "Common Data Model" haben.

Screenshot einer Datenflussliste, die zeigt, wie die model.json Datei aus einem Datenfluss exportiert wird.

Sie können diese JSON-Datei verwenden, um Ihren Datenfluss in einen anderen Arbeitsbereich oder eine andere Umgebung zu migrieren (oder zu importieren).

Screenshot der Datenflusserstellungsseite mit hervorgehobener Auswahl des Importmodells.

Um genau zu erfahren, was die model.json Metadatendatei enthält, wechseln Sie zur Metadatendatei (model.json) für das allgemeine Datenmodell.

Datendateien

Zusätzlich zur Metadatendatei enthält der Datenflussordner weitere Unterordner. Ein Datenfluss speichert die Daten für jede Tabelle in einem Unterordner mit dem Namen der Tabelle. Daten für eine Tabelle können in mehrere Datenpartitionen aufgeteilt werden, die im CSV-Format gespeichert sind.

Allgemeine Datenmodellordner anzeigen oder darauf zugreifen

Wenn Sie Datenflüsse verwenden, die den vom Produkt bereitgestellten Speicher verwenden, in dem sie erstellt wurden, haben Sie keinen Direkten Zugriff auf diese Ordner. In solchen Fällen erfordert das Abrufen von Daten aus den Datenflüssen die Verwendung des Microsoft Power Platform-Datenflusskonnektors, der im Get data-Erlebnis im Power BI-Dienst, Power Apps, Dynamics 365 Customer Insights oder in Power BI Desktop verfügbar ist.

Screenshot der Seite "Datenquelle auswählen" mit dem hervorgehobenen Power Platform-Datenfluss-Connector.

Wenn Sie erfahren möchten, wie Datenflüsse und die interne Data Lake Storage-Integration funktionieren, wechseln Sie zu Dataflows und Azure Data Lake-Integration (Vorschau).

Wenn Ihre Organisation Datenflüsse aktiviert hat, um sein Data Lake Storage-Konto zu nutzen und als Ladeziel für Datenflüsse ausgewählt wurde, können Sie weiterhin Daten aus dem Datenfluss abrufen, indem Sie den Power Platform-Datenflussconnector wie zuvor erwähnt verwenden. Sie können aber auch direkt über den See auf den Gemeinsamen Datenmodellordner des Datenflusses zugreifen, auch außerhalb von Power Platform-Tools und -Diensten. Der Zugriff auf den See ist über das Azure-Portal, den Microsoft Azure Storage-Explorer oder einen anderen Dienst oder eine andere Erfahrung möglich, die Azure Data Lake Storage unterstützt. Weitere Informationen finden Sie unter Connect Azure Data Lake Storage Gen2 für den Datenfluss-Speicher.