Compartir a través de


Referencia de tabla del sistema de ingestión de datos de Zerobus

Este artículo es una referencia para las tablas del sistema zerobus, que realizan un seguimiento de la actividad de ingestión de Zerobus en el área de trabajo. Estas tablas incluyen tus registros de cuenta de todas las áreas de trabajo en tu misma región. Para ver los registros de otra región, debe ver las tablas de un área de trabajo implementada en esa región.

Requisitos

  • Para acceder a estas tablas del sistema, los usuarios deben:

Tablas de ingesta de Zerobus disponibles

Todas las tablas del sistema relacionadas con la ingestión de Zerobus residen en el esquema system.lakeflow. Esto incluye las tablas siguientes:

Table Description Admite transmisión en directo Período gratuito de retención Incluye datos globales o regionales
Zerobus_stream (beta) Hace seguimiento de todas las secuencias creadas mediante la ingesta de Zerobus 365 días Regional
Zerobus_ingest (beta) Realiza un seguimiento de todos los datos en ingestión en tablas Delta utilizando Zerobus Ingest. 365 días Regional

Referencia del esquema de tabla de flujo de Zerobus

La zerobus_stream tabla almacena todos los datos relacionados con los eventos de transmisión originados por el uso de Zerobus Ingest. Esto incluye eventos que se producen cuando se crea una secuencia, cuando se produce un error durante la duración de la secuencia y cuando se cierra una secuencia.

Ruta de acceso de tabla: system.lakeflow.zerobus_stream

Nombre de la columna Tipo de dato Description Example
account_id cuerda / cadena Identificador de la cuenta responsable del flujo 23e22ba4-87b9-4cc2-9770-d10b894bxx
workspace_id cuerda / cadena El ID del entorno de trabajo responsable del flujo de datos 1234567890123456
stream_id cuerda / cadena Identificador del flujo ccr4bf53-127a-4487-camr-cab42c2db9b2
event_time marca de tiempo Marca de tiempo de cuándo se produjo el evento 2025-12-19T18:20:26.994+00:00
producer_id cuerda / cadena Identificador del productor responsable de la creación de la secuencia Esta columna no es compatible actualmente.
opened_time marca de tiempo El momento en que se abrió el flujo 2025-12-19T18:20:27.209+00:00
closed_time marca de tiempo Marca de tiempo en la que se cerró el flujo 2025-12-19T18:20:26.994+00:00
table_id cuerda / cadena El ID de la tabla en la que se está ingiriendo 0c5ca387-5v3c-4308-90ad-b91dedb22e32
table_name cuerda / cadena Nombre completo calificado de la tabla en la que se está ingiriendo example_table
protocol cuerda / cadena Protocolo que se usa para ingerir datos. Los valores posibles son GRPC y HTTP. GRPC
data_format cuerda / cadena Formato de los datos usados en el flujo de datos. Los valores posibles son PROTOBUF y JSON. PROTOBUF
errors array Matriz de errores que se han producido durante la duración de la secuencia Consulte Referencia de errores.

Consultas de ejemplo para la tabla de flujos

La consulta siguiente devuelve el número de flujos abiertos actualmente para una tabla especificada:

SELECT COUNT(stream.stream_id)
FROM system.lakeflow.zerobus_stream AS stream
WHERE stream.table_id=:table_id AND stream.closed_time IS NULL AND stream.opened_time > CURRENT_TIMESTAMP - INTERVAL '15 minutes'

La consulta siguiente devuelve los identificadores de todas las secuencias en las que se incurrió en un error:

SELECT DISTINCT(stream.stream_id)
FROM system.lakeflow.zerobus_stream AS stream
WHERE size(stream.errors) > 0

Referencia del esquema de la tabla de ingesta de Zerobus

La zerobus_ingest tabla almacena todos los datos relacionados con los registros ingeridos mediante Zerobus Ingest. Estos datos no son granulares de nivel de registro. Los datos se agregan por lotes escritos en la tabla Delta, identificados mediante commit_version.

Ruta de acceso de tabla: system.lakeflow.zerobus_ingest

Nombre de la columna Tipo de dato Description Example
account_id cuerda / cadena Identificador de la cuenta que posee el área de trabajo especificada 23e22ba4-87b9-4cc2-9770-d10b894bxx
workspace_id cuerda / cadena Identificador del área de trabajo donde se crea la secuencia 1234567890123456
stream_id cuerda / cadena Identificador del flujo que realizó la ingesta ccr4bf53-127a-4487-camr-cab42c2db9b2
commit_version bigint Número de versión único del commit de Delta 15104
table_id cuerda / cadena Identificador de la tabla en la que se está escribiendo 0c5ca387-5v3c-4308-90ad-b91dedb22e32
table_name cuerda / cadena Nombre completamente cualificado de la tabla en formato legible para humanos example_table
commit_time marca de tiempo Marca de tiempo de la confirmación 2025-12-19T18:20:27.209+00:00
committed_bytes bigint Tamaño de los datos ingeridos en bytes 3532498
committed_records bigint Número de registros confirmados 3445
tags array Etiquetas personalizadas proporcionadas por Zerobus Ingest que se pueden usar para realizar el seguimiento del origen y otros metadatos sobre el uso. ["DIRECT_WRITE"]
errors array Matriz de errores que se han producido durante la ingesta Consulte Referencia de errores.

Consultas de ejemplo para la tabla de ingesta

La consulta siguiente obtiene la tasa de inserción media de cada tabla durante un intervalo de tiempo especificado:

SELECT ingest.table_id AS table_id, SUM(ingest.committed_bytes) / (SECONDS(:end_timestamp - :start_timestamp)) AS average_insertion_rate
FROM system.lakeflow.zerobus_ingest AS ingest
WHERE ingest.commit_time >= :start_timestamp AND ingest.commit_time <= :end_timestamp
GROUP BY ingest.table_id

La consulta siguiente obtiene la cantidad total de datos y registros ingeridos en una tabla durante un intervalo de tiempo especificado:

SELECT SUM(ingest.committed_bytes) as 'Total data', SUM(ingest.committed_records) as 'Total records'
FROM system.lakeflow.zerobus_ingest AS ingest
WHERE ingest.commit_time >= :start_timestamp AND ingest.commit_time <= :end_timestamp AND ingest.table_name = :table_name

Referencia de error

Tanto la transmisión como las tablas de ingesta incluyen una errors columna, que contiene una matriz de errores que se produjeron durante la transmisión o la ingesta, con cada elemento representando un error independiente. Estos elementos de matriz se registran como objetos con los campos siguientes:

Nombre del campo Tipo de dato Description
error_code bigint Código de error
error_message cuerda / cadena Mensaje de error completo
timestamp marca de tiempo Marca de tiempo de cuando se produjo el error

Patrones de Combinación Comunes

En la consulta siguiente se muestra cómo puede combinar la secuencia y ingerir tablas para devolver todas las tablas en las que se han escrito desde un único área de trabajo.

SELECT DISTINCT(stream.table_id)
FROM system.lakeflow.zerobus_stream AS stream INNER JOIN system.lakeflow.zerobus_ingest AS ingest ON (stream_id)
WHERE stream.workspace_id=:workspace_id