Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Este artigo é uma referência para as tabelas do sistema, que acompanham a atividade de Zerobus Ingest em seu workspace. Essas tabelas incluem os registros de sua conta de todos os workspaces na mesma região. Para ver registros de outra região, você deve exibir as tabelas de um workspace implantado nessa região.
Requirements
- Para acessar essas tabelas do sistema, os usuários devem:
- Ser tanto administrador de metastore quanto administrador de workspace, ou
- Tenha permissões de
USEeSELECTnos esquemas do sistema. Veja Conceder acesso às tabelas do sistema.
Tabelas de ingestão do Zerobus disponíveis
Todas as tabelas de sistema relacionadas ao Zerobus Ingest estão no esquema system.lakeflow. Isso inclui as seguintes tabelas:
| Table | Description | Dá suporte ao streaming | Período de retenção gratuito | Inclui dados globais ou regionais |
|---|---|---|---|---|
| Zerobus_stream (Beta) | Controla todos os streams criados usando o Zerobus Ingest | Yes | 365 dias | Regional |
| Zerobus_ingest (Beta) | Registra todos os dados ingeridos em tabelas Delta usando o Zerobus Ingest | Yes | 365 dias | Regional |
Referência de esquema de tabela de fluxo do Zerobus
A zerobus_stream tabela armazena todos os dados relacionados aos eventos de streaming incorridos pelo uso do Zerobus Ingest. Isso inclui eventos que ocorrem quando um fluxo é criado, quando ocorre um erro durante o tempo de vida do fluxo e quando um fluxo é fechado.
Caminho da tabela: system.lakeflow.zerobus_stream
| Nome da coluna | Tipo de dados | Description | Example |
|---|---|---|---|
account_id |
cadeia | A ID da conta responsável pelo fluxo | 23e22ba4-87b9-4cc2-9770-d10b894bxx |
workspace_id |
cadeia | O ID do workspace responsável pelo fluxo | 1234567890123456 |
stream_id |
cadeia | O ID do fluxo | ccr4bf53-127a-4487-camr-cab42c2db9b2 |
event_time |
carimbo de data/hora | A data e hora em que o evento ocorreu | 2025-12-19T18:20:26.994+00:00 |
producer_id |
cadeia | A ID do produtor responsável pela criação do fluxo | No momento, não há suporte para esta coluna. |
opened_time |
carimbo de data/hora | A data e hora de quando o fluxo foi aberto | 2025-12-19T18:20:27.209+00:00 |
closed_time |
carimbo de data/hora | O carimbo de data/hora de quando o fluxo foi fechado | 2025-12-19T18:20:26.994+00:00 |
table_id |
cadeia | A ID da tabela que está sendo ingerida em | 0c5ca387-5v3c-4308-90ad-b91dedb22e32 |
table_name |
cadeia | O nome totalmente qualificado da tabela que está sendo carregada em | example_table |
protocol |
cadeia | O protocolo usado para ingerir dados. Os valores possíveis são: GRPC e HTTP. |
GRPC |
data_format |
cadeia | O formato dos dados usados no fluxo. Os valores possíveis são: PROTOBUF e JSON. |
PROTOBUF |
errors |
matriz | Matriz de erros que ocorreram durante o tempo de vida do fluxo | Consulte a referência de erro |
Exemplo de consultas para a tabela de fluxo
A consulta a seguir retorna o número de fluxos abertos no momento para uma tabela especificada:
SELECT COUNT(stream.stream_id)
FROM system.lakeflow.zerobus_stream AS stream
WHERE stream.table_id=:table_id AND stream.closed_time IS NULL AND stream.opened_time > CURRENT_TIMESTAMP - INTERVAL '15 minutes'
A consulta a seguir retorna as IDs de todos os fluxos que incorreram em um erro:
SELECT DISTINCT(stream.stream_id)
FROM system.lakeflow.zerobus_stream AS stream
WHERE size(stream.errors) > 0
Referência de esquema de tabela de ingestão Zerobus
A tabela zerobus_ingest armazena todos os dados relacionados aos registros ingeridos usando Zerobus Ingest. Esses dados não são granulares a nível de registro individual. Os dados são agregados por lotes gravados na tabela Delta, identificados usando o commit_version.
Caminho da tabela: system.lakeflow.zerobus_ingest
| Nome da coluna | Tipo de dados | Description | Example |
|---|---|---|---|
account_id |
cadeia | ID da conta que possui o workspace fornecido | 23e22ba4-87b9-4cc2-9770-d10b894bxx |
workspace_id |
cadeia | ID do workspace no qual o fluxo é criado | 1234567890123456 |
stream_id |
cadeia | ID do fluxo que executou a ingestão | ccr4bf53-127a-4487-camr-cab42c2db9b2 |
commit_version |
bigint | Número de versão exclusivo do commit para o Delta | 15104 |
table_id |
cadeia | ID da tabela que está sendo escrita em | 0c5ca387-5v3c-4308-90ad-b91dedb22e32 |
table_name |
cadeia | Nome da tabela totalmente qualificado no formato legível humano | example_table |
commit_time |
carimbo de data/hora | Marca temporal do commit | 2025-12-19T18:20:27.209+00:00 |
committed_bytes |
bigint | Tamanho dos dados ingeridos em bytes | 3532498 |
committed_records |
bigint | Número de registros confirmados | 3445 |
tags |
matriz | Tags personalizadas fornecidas pelo Zerobus Ingest que podem ser usadas para rastrear a origem de uso e outros metadados | ["DIRECT_WRITE"] |
errors |
matriz | Matriz de erros que ocorreram durante a ingestão | Consulte a referência de erro |
Exemplo de consultas para a tabela de ingestão
A consulta a seguir obtém a taxa média de inserção para cada tabela durante um intervalo de tempo especificado:
SELECT ingest.table_id AS table_id, SUM(ingest.committed_bytes) / (SECONDS(:end_timestamp - :start_timestamp)) AS average_insertion_rate
FROM system.lakeflow.zerobus_ingest AS ingest
WHERE ingest.commit_time >= :start_timestamp AND ingest.commit_time <= :end_timestamp
GROUP BY ingest.table_id
A consulta a seguir obtém a quantidade total de dados e registros ingeridos em uma tabela durante um intervalo de tempo especificado:
SELECT SUM(ingest.committed_bytes) as 'Total data', SUM(ingest.committed_records) as 'Total records'
FROM system.lakeflow.zerobus_ingest AS ingest
WHERE ingest.commit_time >= :start_timestamp AND ingest.commit_time <= :end_timestamp AND ingest.table_name = :table_name
Referência de erro
As tabelas de fluxo e ingestão incluem uma errors coluna, que inclui uma matriz de erros que ocorreram durante o fluxo ou ingestão, com cada elemento representando um erro separado. Esses elementos de matriz são registrados como objetos com os seguintes campos:
| Nome do campo | Tipo de dados | Description |
|---|---|---|
error_code |
bigint | Código do erro |
error_message |
cadeia | Mensagem de erro completa |
timestamp |
carimbo de data/hora | Carimbo de data/hora de quando o erro ocorreu |
Padrões de junção comuns
A consulta a seguir mostra como você pode unir o fluxo e ingerir tabelas para retornar todas as tabelas que foram gravadas em um único workspace.
SELECT DISTINCT(stream.table_id)
FROM system.lakeflow.zerobus_stream AS stream INNER JOIN system.lakeflow.zerobus_ingest AS ingest ON (stream_id)
WHERE stream.workspace_id=:workspace_id