Freigeben über


Zerobus Ingest-Systemtabellenreferenz

Dieser Artikel ist eine Referenz für die zerobus Systemtabellen, die die Zerobus-Datenaufnahmeaktivität in Ihrem Arbeitsbereich nachverfolgen. Diese Tabellen enthalten Ihre Kontodatensätze aus allen Arbeitsbereichen in derselben Region. Um Datensätze aus einer anderen Region anzuzeigen, müssen Sie die Tabellen aus einem Arbeitsbereich anzeigen, der in dieser Region bereitgestellt wird.

Anforderungen

  • Um auf diese Systemtabellen zuzugreifen, müssen Benutzer eine der folgenden Aktionen ausführen:
    • Seien Sie sowohl Metastore-Administrator als auch Arbeitsbereichsadministrator.
    • Verfügen Sie über USE- und SELECT-Berechtigungen für die Systemschemata. Siehe Gewähren des Zugriffs auf Systemtabellen.

Verfügbare Zerobus-Erfassungstabellen

Alle zugehörigen Systemtabellen von Zerobus Ingest befinden sich im system.lakeflow Schema. Dazu gehören die folgenden Tabellen:

Table Description Unterstützt Streaming Kostenfreier Aufbewahrungszeitraum Einschließlich globaler oder regionaler Daten
Zerobus_stream (Beta) Verfolgt alle datenströme, die mit Zerobus Ingest erstellt wurden Yes 365 Tage Länderspezifisch
Zerobus_ingest (Beta) Verfolgt alle in Delta-Tabellen aufgenommenen Daten mithilfe von Zerobus Ingest Yes 365 Tage Länderspezifisch

Schemareferenz für Zerobus-Datenstromtabellen

In der zerobus_stream Tabelle werden alle Daten gespeichert, die sich auf Datenstromereignisse beziehen, die durch die Verwendung von Zerobus Ingest entstehen. Dies schließt Ereignisse ein, die auftreten, wenn ein Datenstrom erstellt wird, wenn während der Lebensdauer des Datenstroms ein Fehler auftritt und wenn ein Datenstrom geschlossen wird.

Tabellenpfad: system.lakeflow.zerobus_stream

Spaltenname Datentyp Description Example
account_id Schnur Die ID des für den Datenstrom verantwortlichen Kontos 23e22ba4-87b9-4cc2-9770-d10b894bxx
workspace_id Schnur Die ID des Arbeitsbereichs, der für den Datenstrom verantwortlich ist 1234567890123456
stream_id Schnur Die ID des Datenstroms ccr4bf53-127a-4487-camr-cab42c2db9b2
event_time Zeitstempel Der Zeitstempel des Zeitpunkts, an dem das Ereignis aufgetreten ist 2025-12-19T18:20:26.994+00:00
producer_id Schnur Die ID des Produzenten, der für die Datenstromerstellung verantwortlich ist Diese Spalte wird derzeit nicht unterstützt.
opened_time Zeitstempel Der Zeitstempel des Zeitpunkts, zu dem der Datenstrom geöffnet wurde 2025-12-19T18:20:27.209+00:00
closed_time Zeitstempel Der Zeitstempel, wann der Datenstrom geschlossen wurde 2025-12-19T18:20:26.994+00:00
table_id Schnur Die ID der Tabelle, in die Daten eingespeist werden 0c5ca387-5v3c-4308-90ad-b91dedb22e32
table_name Schnur Der vollqualifizierte Name der Tabelle, in die aufgenommen wird example_table
protocol Schnur Das Protokoll, das zum Aufnehmen von Daten verwendet wird. Mögliche Werte sind GRPC und HTTP. GRPC
data_format Schnur Das Format der im Datenstrom verwendeten Daten. Mögliche Werte sind PROTOBUF und JSON. PROTOBUF
errors Array Array von Fehlern, die während der Lebensdauer des Datenstroms aufgetreten sind Siehe Fehlerreferenz

Beispielabfragen für die Datenstromtabelle

Die folgende Abfrage gibt die Anzahl der aktuell geöffneten Datenströme für eine angegebene Tabelle zurück:

SELECT COUNT(stream.stream_id)
FROM system.lakeflow.zerobus_stream AS stream
WHERE stream.table_id=:table_id AND stream.closed_time IS NULL AND stream.opened_time > CURRENT_TIMESTAMP - INTERVAL '15 minutes'

Die folgende Abfrage gibt die IDs aller Datenströme zurück, die einen Fehler verursacht haben:

SELECT DISTINCT(stream.stream_id)
FROM system.lakeflow.zerobus_stream AS stream
WHERE size(stream.errors) > 0

Zerobus-Aufnahmetabellenschemareferenz

Die zerobus_ingest Tabelle speichert alle Daten im Zusammenhang mit Datensätzen, die mit Zerobus Ingest aufgenommen wurden. Diese Daten sind nicht feinkörnig auf Datensatzebene. Die Daten werden durch Batches aggregiert, die in die Delta-Tabelle geschrieben werden, die mithilfe der commit_version identifiziert werden.

Tabellenpfad: system.lakeflow.zerobus_ingest

Spaltenname Datentyp Description Example
account_id Schnur ID des Kontos, das dem angegebenen Arbeitsbereich gehört 23e22ba4-87b9-4cc2-9770-d10b894bxx
workspace_id Schnur ID des Arbeitsbereichs, in dem der Datenstrom erstellt wird 1234567890123456
stream_id Schnur ID des Streams, der die Datenaufnahme ausgeführt hat ccr4bf53-127a-4487-camr-cab42c2db9b2
commit_version bigint Eindeutige Versionsnummer des Commits für das Delta 15104
table_id Schnur ID der Tabelle, in die geschrieben wird 0c5ca387-5v3c-4308-90ad-b91dedb22e32
table_name Schnur Vollständig qualifizierter Tabellenname im für Menschen lesbaren Format example_table
commit_time Zeitstempel Zeitstempel des Commits 2025-12-19T18:20:27.209+00:00
committed_bytes bigint Größe der aufgenommenen Daten in Byte 3532498
committed_records bigint Anzahl der zugesicherten Datensätze 3445
tags Array Benutzerdefinierte Tags, die von Zerobus Ingest bereitgestellt werden, die zum Nachverfolgen des Verwendungsursprungs und anderer Metadaten verwendet werden können ["DIRECT_WRITE"]
errors Array Anordnung von Fehlern, die während des Einlesens aufgetreten sind Siehe Fehlerreferenz

Beispielabfragen zur Eingabetabelle

Die folgende Abfrage ruft die durchschnittliche Einfügerate für jede Tabelle während eines angegebenen Zeitraums ab:

SELECT ingest.table_id AS table_id, SUM(ingest.committed_bytes) / (SECONDS(:end_timestamp - :start_timestamp)) AS average_insertion_rate
FROM system.lakeflow.zerobus_ingest AS ingest
WHERE ingest.commit_time >= :start_timestamp AND ingest.commit_time <= :end_timestamp
GROUP BY ingest.table_id

Die folgende Abfrage ruft die Gesamtmenge der Daten und Datensätze ab, die während eines bestimmten Zeitraums in eine Tabelle aufgenommen wurden:

SELECT SUM(ingest.committed_bytes) as 'Total data', SUM(ingest.committed_records) as 'Total records'
FROM system.lakeflow.zerobus_ingest AS ingest
WHERE ingest.commit_time >= :start_timestamp AND ingest.commit_time <= :end_timestamp AND ingest.table_name = :table_name

Fehlerreferenz

Sowohl die Datenstrom- als auch die Aufnahmetabellen enthalten eine errors Spalte, die ein Array von Fehlern enthält, die während des Datenstroms oder der Aufnahme aufgetreten sind, wobei jedes Element einen separaten Fehler darstellt. Diese Arrayelemente werden als Objekte mit den folgenden Feldern aufgezeichnet:

Feldname Datentyp Description
error_code bigint Fehlercode
error_message Schnur Vollständige Fehlermeldung
timestamp Zeitstempel Zeitstempel des Auftretens des Fehlers

Allgemeine Verknüpfungsmuster

Die folgende Abfrage zeigt, wie Sie den Datenstrom verknüpfen und Tabellen aufnehmen können, um alle Tabellen zurückzugeben, in die aus einem einzigen Arbeitsbereich geschrieben wurden.

SELECT DISTINCT(stream.table_id)
FROM system.lakeflow.zerobus_stream AS stream INNER JOIN system.lakeflow.zerobus_ingest AS ingest ON (stream_id)
WHERE stream.workspace_id=:workspace_id