Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Dieser Artikel ist eine Referenz für die zerobus Systemtabellen, die die Zerobus-Datenaufnahmeaktivität in Ihrem Arbeitsbereich nachverfolgen. Diese Tabellen enthalten Ihre Kontodatensätze aus allen Arbeitsbereichen in derselben Region. Um Datensätze aus einer anderen Region anzuzeigen, müssen Sie die Tabellen aus einem Arbeitsbereich anzeigen, der in dieser Region bereitgestellt wird.
Anforderungen
- Um auf diese Systemtabellen zuzugreifen, müssen Benutzer eine der folgenden Aktionen ausführen:
- Seien Sie sowohl Metastore-Administrator als auch Arbeitsbereichsadministrator.
- Verfügen Sie über
USE- undSELECT-Berechtigungen für die Systemschemata. Siehe Gewähren des Zugriffs auf Systemtabellen.
Verfügbare Zerobus-Erfassungstabellen
Alle zugehörigen Systemtabellen von Zerobus Ingest befinden sich im system.lakeflow Schema. Dazu gehören die folgenden Tabellen:
| Table | Description | Unterstützt Streaming | Kostenfreier Aufbewahrungszeitraum | Einschließlich globaler oder regionaler Daten |
|---|---|---|---|---|
| Zerobus_stream (Beta) | Verfolgt alle datenströme, die mit Zerobus Ingest erstellt wurden | Yes | 365 Tage | Länderspezifisch |
| Zerobus_ingest (Beta) | Verfolgt alle in Delta-Tabellen aufgenommenen Daten mithilfe von Zerobus Ingest | Yes | 365 Tage | Länderspezifisch |
Schemareferenz für Zerobus-Datenstromtabellen
In der zerobus_stream Tabelle werden alle Daten gespeichert, die sich auf Datenstromereignisse beziehen, die durch die Verwendung von Zerobus Ingest entstehen. Dies schließt Ereignisse ein, die auftreten, wenn ein Datenstrom erstellt wird, wenn während der Lebensdauer des Datenstroms ein Fehler auftritt und wenn ein Datenstrom geschlossen wird.
Tabellenpfad: system.lakeflow.zerobus_stream
| Spaltenname | Datentyp | Description | Example |
|---|---|---|---|
account_id |
Schnur | Die ID des für den Datenstrom verantwortlichen Kontos | 23e22ba4-87b9-4cc2-9770-d10b894bxx |
workspace_id |
Schnur | Die ID des Arbeitsbereichs, der für den Datenstrom verantwortlich ist | 1234567890123456 |
stream_id |
Schnur | Die ID des Datenstroms | ccr4bf53-127a-4487-camr-cab42c2db9b2 |
event_time |
Zeitstempel | Der Zeitstempel des Zeitpunkts, an dem das Ereignis aufgetreten ist | 2025-12-19T18:20:26.994+00:00 |
producer_id |
Schnur | Die ID des Produzenten, der für die Datenstromerstellung verantwortlich ist | Diese Spalte wird derzeit nicht unterstützt. |
opened_time |
Zeitstempel | Der Zeitstempel des Zeitpunkts, zu dem der Datenstrom geöffnet wurde | 2025-12-19T18:20:27.209+00:00 |
closed_time |
Zeitstempel | Der Zeitstempel, wann der Datenstrom geschlossen wurde | 2025-12-19T18:20:26.994+00:00 |
table_id |
Schnur | Die ID der Tabelle, in die Daten eingespeist werden | 0c5ca387-5v3c-4308-90ad-b91dedb22e32 |
table_name |
Schnur | Der vollqualifizierte Name der Tabelle, in die aufgenommen wird | example_table |
protocol |
Schnur | Das Protokoll, das zum Aufnehmen von Daten verwendet wird. Mögliche Werte sind GRPC und HTTP. |
GRPC |
data_format |
Schnur | Das Format der im Datenstrom verwendeten Daten. Mögliche Werte sind PROTOBUF und JSON. |
PROTOBUF |
errors |
Array | Array von Fehlern, die während der Lebensdauer des Datenstroms aufgetreten sind | Siehe Fehlerreferenz |
Beispielabfragen für die Datenstromtabelle
Die folgende Abfrage gibt die Anzahl der aktuell geöffneten Datenströme für eine angegebene Tabelle zurück:
SELECT COUNT(stream.stream_id)
FROM system.lakeflow.zerobus_stream AS stream
WHERE stream.table_id=:table_id AND stream.closed_time IS NULL AND stream.opened_time > CURRENT_TIMESTAMP - INTERVAL '15 minutes'
Die folgende Abfrage gibt die IDs aller Datenströme zurück, die einen Fehler verursacht haben:
SELECT DISTINCT(stream.stream_id)
FROM system.lakeflow.zerobus_stream AS stream
WHERE size(stream.errors) > 0
Zerobus-Aufnahmetabellenschemareferenz
Die zerobus_ingest Tabelle speichert alle Daten im Zusammenhang mit Datensätzen, die mit Zerobus Ingest aufgenommen wurden. Diese Daten sind nicht feinkörnig auf Datensatzebene. Die Daten werden durch Batches aggregiert, die in die Delta-Tabelle geschrieben werden, die mithilfe der commit_version identifiziert werden.
Tabellenpfad: system.lakeflow.zerobus_ingest
| Spaltenname | Datentyp | Description | Example |
|---|---|---|---|
account_id |
Schnur | ID des Kontos, das dem angegebenen Arbeitsbereich gehört | 23e22ba4-87b9-4cc2-9770-d10b894bxx |
workspace_id |
Schnur | ID des Arbeitsbereichs, in dem der Datenstrom erstellt wird | 1234567890123456 |
stream_id |
Schnur | ID des Streams, der die Datenaufnahme ausgeführt hat | ccr4bf53-127a-4487-camr-cab42c2db9b2 |
commit_version |
bigint | Eindeutige Versionsnummer des Commits für das Delta | 15104 |
table_id |
Schnur | ID der Tabelle, in die geschrieben wird | 0c5ca387-5v3c-4308-90ad-b91dedb22e32 |
table_name |
Schnur | Vollständig qualifizierter Tabellenname im für Menschen lesbaren Format | example_table |
commit_time |
Zeitstempel | Zeitstempel des Commits | 2025-12-19T18:20:27.209+00:00 |
committed_bytes |
bigint | Größe der aufgenommenen Daten in Byte | 3532498 |
committed_records |
bigint | Anzahl der zugesicherten Datensätze | 3445 |
tags |
Array | Benutzerdefinierte Tags, die von Zerobus Ingest bereitgestellt werden, die zum Nachverfolgen des Verwendungsursprungs und anderer Metadaten verwendet werden können | ["DIRECT_WRITE"] |
errors |
Array | Anordnung von Fehlern, die während des Einlesens aufgetreten sind | Siehe Fehlerreferenz |
Beispielabfragen zur Eingabetabelle
Die folgende Abfrage ruft die durchschnittliche Einfügerate für jede Tabelle während eines angegebenen Zeitraums ab:
SELECT ingest.table_id AS table_id, SUM(ingest.committed_bytes) / (SECONDS(:end_timestamp - :start_timestamp)) AS average_insertion_rate
FROM system.lakeflow.zerobus_ingest AS ingest
WHERE ingest.commit_time >= :start_timestamp AND ingest.commit_time <= :end_timestamp
GROUP BY ingest.table_id
Die folgende Abfrage ruft die Gesamtmenge der Daten und Datensätze ab, die während eines bestimmten Zeitraums in eine Tabelle aufgenommen wurden:
SELECT SUM(ingest.committed_bytes) as 'Total data', SUM(ingest.committed_records) as 'Total records'
FROM system.lakeflow.zerobus_ingest AS ingest
WHERE ingest.commit_time >= :start_timestamp AND ingest.commit_time <= :end_timestamp AND ingest.table_name = :table_name
Fehlerreferenz
Sowohl die Datenstrom- als auch die Aufnahmetabellen enthalten eine errors Spalte, die ein Array von Fehlern enthält, die während des Datenstroms oder der Aufnahme aufgetreten sind, wobei jedes Element einen separaten Fehler darstellt. Diese Arrayelemente werden als Objekte mit den folgenden Feldern aufgezeichnet:
| Feldname | Datentyp | Description |
|---|---|---|
error_code |
bigint | Fehlercode |
error_message |
Schnur | Vollständige Fehlermeldung |
timestamp |
Zeitstempel | Zeitstempel des Auftretens des Fehlers |
Allgemeine Verknüpfungsmuster
Die folgende Abfrage zeigt, wie Sie den Datenstrom verknüpfen und Tabellen aufnehmen können, um alle Tabellen zurückzugeben, in die aus einem einzigen Arbeitsbereich geschrieben wurden.
SELECT DISTINCT(stream.table_id)
FROM system.lakeflow.zerobus_stream AS stream INNER JOIN system.lakeflow.zerobus_ingest AS ingest ON (stream_id)
WHERE stream.workspace_id=:workspace_id