Compartilhar via


Referência da tabela do sistema de ingestão Zerobus

Este artigo é uma referência para as tabelas do sistema, que acompanham a atividade de Zerobus Ingest em seu workspace. Essas tabelas incluem os registros de sua conta de todos os workspaces na mesma região. Para ver registros de outra região, você deve exibir as tabelas de um workspace implantado nessa região.

Requirements

  • Para acessar essas tabelas do sistema, os usuários devem:

Tabelas de ingestão do Zerobus disponíveis

Todas as tabelas de sistema relacionadas ao Zerobus Ingest estão no esquema system.lakeflow. Isso inclui as seguintes tabelas:

Table Description Dá suporte ao streaming Período de retenção gratuito Inclui dados globais ou regionais
Zerobus_stream (Beta) Controla todos os streams criados usando o Zerobus Ingest Yes 365 dias Regional
Zerobus_ingest (Beta) Registra todos os dados ingeridos em tabelas Delta usando o Zerobus Ingest Yes 365 dias Regional

Referência de esquema de tabela de fluxo do Zerobus

A zerobus_stream tabela armazena todos os dados relacionados aos eventos de streaming incorridos pelo uso do Zerobus Ingest. Isso inclui eventos que ocorrem quando um fluxo é criado, quando ocorre um erro durante o tempo de vida do fluxo e quando um fluxo é fechado.

Caminho da tabela: system.lakeflow.zerobus_stream

Nome da coluna Tipo de dados Description Example
account_id cadeia A ID da conta responsável pelo fluxo 23e22ba4-87b9-4cc2-9770-d10b894bxx
workspace_id cadeia O ID do workspace responsável pelo fluxo 1234567890123456
stream_id cadeia O ID do fluxo ccr4bf53-127a-4487-camr-cab42c2db9b2
event_time carimbo de data/hora A data e hora em que o evento ocorreu 2025-12-19T18:20:26.994+00:00
producer_id cadeia A ID do produtor responsável pela criação do fluxo No momento, não há suporte para esta coluna.
opened_time carimbo de data/hora A data e hora de quando o fluxo foi aberto 2025-12-19T18:20:27.209+00:00
closed_time carimbo de data/hora O carimbo de data/hora de quando o fluxo foi fechado 2025-12-19T18:20:26.994+00:00
table_id cadeia A ID da tabela que está sendo ingerida em 0c5ca387-5v3c-4308-90ad-b91dedb22e32
table_name cadeia O nome totalmente qualificado da tabela que está sendo carregada em example_table
protocol cadeia O protocolo usado para ingerir dados. Os valores possíveis são: GRPC e HTTP. GRPC
data_format cadeia O formato dos dados usados no fluxo. Os valores possíveis são: PROTOBUF e JSON. PROTOBUF
errors matriz Matriz de erros que ocorreram durante o tempo de vida do fluxo Consulte a referência de erro

Exemplo de consultas para a tabela de fluxo

A consulta a seguir retorna o número de fluxos abertos no momento para uma tabela especificada:

SELECT COUNT(stream.stream_id)
FROM system.lakeflow.zerobus_stream AS stream
WHERE stream.table_id=:table_id AND stream.closed_time IS NULL AND stream.opened_time > CURRENT_TIMESTAMP - INTERVAL '15 minutes'

A consulta a seguir retorna as IDs de todos os fluxos que incorreram em um erro:

SELECT DISTINCT(stream.stream_id)
FROM system.lakeflow.zerobus_stream AS stream
WHERE size(stream.errors) > 0

Referência de esquema de tabela de ingestão Zerobus

A tabela zerobus_ingest armazena todos os dados relacionados aos registros ingeridos usando Zerobus Ingest. Esses dados não são granulares a nível de registro individual. Os dados são agregados por lotes gravados na tabela Delta, identificados usando o commit_version.

Caminho da tabela: system.lakeflow.zerobus_ingest

Nome da coluna Tipo de dados Description Example
account_id cadeia ID da conta que possui o workspace fornecido 23e22ba4-87b9-4cc2-9770-d10b894bxx
workspace_id cadeia ID do workspace no qual o fluxo é criado 1234567890123456
stream_id cadeia ID do fluxo que executou a ingestão ccr4bf53-127a-4487-camr-cab42c2db9b2
commit_version bigint Número de versão exclusivo do commit para o Delta 15104
table_id cadeia ID da tabela que está sendo escrita em 0c5ca387-5v3c-4308-90ad-b91dedb22e32
table_name cadeia Nome da tabela totalmente qualificado no formato legível humano example_table
commit_time carimbo de data/hora Marca temporal do commit 2025-12-19T18:20:27.209+00:00
committed_bytes bigint Tamanho dos dados ingeridos em bytes 3532498
committed_records bigint Número de registros confirmados 3445
tags matriz Tags personalizadas fornecidas pelo Zerobus Ingest que podem ser usadas para rastrear a origem de uso e outros metadados ["DIRECT_WRITE"]
errors matriz Matriz de erros que ocorreram durante a ingestão Consulte a referência de erro

Exemplo de consultas para a tabela de ingestão

A consulta a seguir obtém a taxa média de inserção para cada tabela durante um intervalo de tempo especificado:

SELECT ingest.table_id AS table_id, SUM(ingest.committed_bytes) / (SECONDS(:end_timestamp - :start_timestamp)) AS average_insertion_rate
FROM system.lakeflow.zerobus_ingest AS ingest
WHERE ingest.commit_time >= :start_timestamp AND ingest.commit_time <= :end_timestamp
GROUP BY ingest.table_id

A consulta a seguir obtém a quantidade total de dados e registros ingeridos em uma tabela durante um intervalo de tempo especificado:

SELECT SUM(ingest.committed_bytes) as 'Total data', SUM(ingest.committed_records) as 'Total records'
FROM system.lakeflow.zerobus_ingest AS ingest
WHERE ingest.commit_time >= :start_timestamp AND ingest.commit_time <= :end_timestamp AND ingest.table_name = :table_name

Referência de erro

As tabelas de fluxo e ingestão incluem uma errors coluna, que inclui uma matriz de erros que ocorreram durante o fluxo ou ingestão, com cada elemento representando um erro separado. Esses elementos de matriz são registrados como objetos com os seguintes campos:

Nome do campo Tipo de dados Description
error_code bigint Código do erro
error_message cadeia Mensagem de erro completa
timestamp carimbo de data/hora Carimbo de data/hora de quando o erro ocorreu

Padrões de junção comuns

A consulta a seguir mostra como você pode unir o fluxo e ingerir tabelas para retornar todas as tabelas que foram gravadas em um único workspace.

SELECT DISTINCT(stream.table_id)
FROM system.lakeflow.zerobus_stream AS stream INNER JOIN system.lakeflow.zerobus_ingest AS ingest ON (stream_id)
WHERE stream.workspace_id=:workspace_id