Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Este artículo es una referencia para las tablas del sistema zerobus, que realizan un seguimiento de la actividad de ingestión de Zerobus en el área de trabajo. Estas tablas incluyen tus registros de cuenta de todas las áreas de trabajo en tu misma región. Para ver los registros de otra región, debe ver las tablas de un área de trabajo implementada en esa región.
Requisitos
- Para acceder a estas tablas del sistema, los usuarios deben:
- Ser un administrador de metastore y un administrador del área de trabajo, o bien
- Tener permisos
USEySELECTen los esquemas del sistema. Consulte Conceder acceso a las tablas del sistema.
Tablas de ingesta de Zerobus disponibles
Todas las tablas del sistema relacionadas con la ingestión de Zerobus residen en el esquema system.lakeflow. Esto incluye las tablas siguientes:
| Table | Description | Admite transmisión en directo | Período gratuito de retención | Incluye datos globales o regionales |
|---|---|---|---|---|
| Zerobus_stream (beta) | Hace seguimiento de todas las secuencias creadas mediante la ingesta de Zerobus | Sí | 365 días | Regional |
| Zerobus_ingest (beta) | Realiza un seguimiento de todos los datos en ingestión en tablas Delta utilizando Zerobus Ingest. | Sí | 365 días | Regional |
Referencia del esquema de tabla de flujo de Zerobus
La zerobus_stream tabla almacena todos los datos relacionados con los eventos de transmisión originados por el uso de Zerobus Ingest. Esto incluye eventos que se producen cuando se crea una secuencia, cuando se produce un error durante la duración de la secuencia y cuando se cierra una secuencia.
Ruta de acceso de tabla: system.lakeflow.zerobus_stream
| Nombre de la columna | Tipo de dato | Description | Example |
|---|---|---|---|
account_id |
cuerda / cadena | Identificador de la cuenta responsable del flujo | 23e22ba4-87b9-4cc2-9770-d10b894bxx |
workspace_id |
cuerda / cadena | El ID del entorno de trabajo responsable del flujo de datos | 1234567890123456 |
stream_id |
cuerda / cadena | Identificador del flujo | ccr4bf53-127a-4487-camr-cab42c2db9b2 |
event_time |
marca de tiempo | Marca de tiempo de cuándo se produjo el evento | 2025-12-19T18:20:26.994+00:00 |
producer_id |
cuerda / cadena | Identificador del productor responsable de la creación de la secuencia | Esta columna no es compatible actualmente. |
opened_time |
marca de tiempo | El momento en que se abrió el flujo | 2025-12-19T18:20:27.209+00:00 |
closed_time |
marca de tiempo | Marca de tiempo en la que se cerró el flujo | 2025-12-19T18:20:26.994+00:00 |
table_id |
cuerda / cadena | El ID de la tabla en la que se está ingiriendo | 0c5ca387-5v3c-4308-90ad-b91dedb22e32 |
table_name |
cuerda / cadena | Nombre completo calificado de la tabla en la que se está ingiriendo | example_table |
protocol |
cuerda / cadena | Protocolo que se usa para ingerir datos. Los valores posibles son GRPC y HTTP. |
GRPC |
data_format |
cuerda / cadena | Formato de los datos usados en el flujo de datos. Los valores posibles son PROTOBUF y JSON. |
PROTOBUF |
errors |
array | Matriz de errores que se han producido durante la duración de la secuencia | Consulte Referencia de errores. |
Consultas de ejemplo para la tabla de flujos
La consulta siguiente devuelve el número de flujos abiertos actualmente para una tabla especificada:
SELECT COUNT(stream.stream_id)
FROM system.lakeflow.zerobus_stream AS stream
WHERE stream.table_id=:table_id AND stream.closed_time IS NULL AND stream.opened_time > CURRENT_TIMESTAMP - INTERVAL '15 minutes'
La consulta siguiente devuelve los identificadores de todas las secuencias en las que se incurrió en un error:
SELECT DISTINCT(stream.stream_id)
FROM system.lakeflow.zerobus_stream AS stream
WHERE size(stream.errors) > 0
Referencia del esquema de la tabla de ingesta de Zerobus
La zerobus_ingest tabla almacena todos los datos relacionados con los registros ingeridos mediante Zerobus Ingest. Estos datos no son granulares de nivel de registro. Los datos se agregan por lotes escritos en la tabla Delta, identificados mediante commit_version.
Ruta de acceso de tabla: system.lakeflow.zerobus_ingest
| Nombre de la columna | Tipo de dato | Description | Example |
|---|---|---|---|
account_id |
cuerda / cadena | Identificador de la cuenta que posee el área de trabajo especificada | 23e22ba4-87b9-4cc2-9770-d10b894bxx |
workspace_id |
cuerda / cadena | Identificador del área de trabajo donde se crea la secuencia | 1234567890123456 |
stream_id |
cuerda / cadena | Identificador del flujo que realizó la ingesta | ccr4bf53-127a-4487-camr-cab42c2db9b2 |
commit_version |
bigint | Número de versión único del commit de Delta | 15104 |
table_id |
cuerda / cadena | Identificador de la tabla en la que se está escribiendo | 0c5ca387-5v3c-4308-90ad-b91dedb22e32 |
table_name |
cuerda / cadena | Nombre completamente cualificado de la tabla en formato legible para humanos | example_table |
commit_time |
marca de tiempo | Marca de tiempo de la confirmación | 2025-12-19T18:20:27.209+00:00 |
committed_bytes |
bigint | Tamaño de los datos ingeridos en bytes | 3532498 |
committed_records |
bigint | Número de registros confirmados | 3445 |
tags |
array | Etiquetas personalizadas proporcionadas por Zerobus Ingest que se pueden usar para realizar el seguimiento del origen y otros metadatos sobre el uso. | ["DIRECT_WRITE"] |
errors |
array | Matriz de errores que se han producido durante la ingesta | Consulte Referencia de errores. |
Consultas de ejemplo para la tabla de ingesta
La consulta siguiente obtiene la tasa de inserción media de cada tabla durante un intervalo de tiempo especificado:
SELECT ingest.table_id AS table_id, SUM(ingest.committed_bytes) / (SECONDS(:end_timestamp - :start_timestamp)) AS average_insertion_rate
FROM system.lakeflow.zerobus_ingest AS ingest
WHERE ingest.commit_time >= :start_timestamp AND ingest.commit_time <= :end_timestamp
GROUP BY ingest.table_id
La consulta siguiente obtiene la cantidad total de datos y registros ingeridos en una tabla durante un intervalo de tiempo especificado:
SELECT SUM(ingest.committed_bytes) as 'Total data', SUM(ingest.committed_records) as 'Total records'
FROM system.lakeflow.zerobus_ingest AS ingest
WHERE ingest.commit_time >= :start_timestamp AND ingest.commit_time <= :end_timestamp AND ingest.table_name = :table_name
Referencia de error
Tanto la transmisión como las tablas de ingesta incluyen una errors columna, que contiene una matriz de errores que se produjeron durante la transmisión o la ingesta, con cada elemento representando un error independiente. Estos elementos de matriz se registran como objetos con los campos siguientes:
| Nombre del campo | Tipo de dato | Description |
|---|---|---|
error_code |
bigint | Código de error |
error_message |
cuerda / cadena | Mensaje de error completo |
timestamp |
marca de tiempo | Marca de tiempo de cuando se produjo el error |
Patrones de Combinación Comunes
En la consulta siguiente se muestra cómo puede combinar la secuencia y ingerir tablas para devolver todas las tablas en las que se han escrito desde un único área de trabajo.
SELECT DISTINCT(stream.table_id)
FROM system.lakeflow.zerobus_stream AS stream INNER JOIN system.lakeflow.zerobus_ingest AS ingest ON (stream_id)
WHERE stream.workspace_id=:workspace_id