Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Aplica-se a:
Databricks SQL
Databricks Runtime 11.3 LTS e versões posteriores
Reorganizar uma tabela Delta Lake reescrevendo arquivos para remover dados excluídos logicamente, como os dados de coluna descartados pelo ALTER TABLE DROP COLUMN, ou realizando o checkpointing do Delta Lake para melhorar o gerenciamento de metadados.
Sintaxe
REORG [ TABLE ] table_name { [ WHERE predicate ] APPLY ( PURGE ) |
APPLY ( UPGRADE UNIFORM ( ICEBERG_COMPAT_VERSION = version ) |
CHECKPOINT ) }
Para versões do Databricks Runtime anteriores à 15.4 TABLE , é uma palavra-chave obrigatória.
Observação
-
APPLY (PURGE)regenera apenas arquivos que contêm dados excluídos temporariamente. -
APPLY (UPGRADE)pode regenerar todos os arquivos. - A
REORG TABLEé idempotente, o que significa que, se for executada duas vezes no mesmo conjunto de dados, a segunda execução não terá efeito. - Depois de executar a
APPLY (PURGE), os dados excluídos de forma temporária ainda podem existir nos arquivos antigos. Você pode executar VACUUM para excluir fisicamente os arquivos antigos. -
APPLY (CHECKPOINT)requer que a tabela tenha o recurso de tabela de Ponto de Verificação V2 habilitado para evitar corrupção causada por condições de corrida.
Parâmetros
-
Identifica uma tabela do Delta existente. O nome não deve incluir uma especificação temporal ou especificação de opções.
WHEREpredicadoO
APPLY (PURGE), reorganiza os arquivos que correspondem ao predicado de partição fornecido. Há suporte apenas para filtros que envolvam atributos de chave de partição.APPLY (PURGE)Especifica que a finalidade da reconfiguração de arquivo é limpar dados excluídos de forma reversível. Confira Limpar exclusões somente de metadados para forçar a regeneração de dados.
APPLY (UPGRADE UNIFORM ( ICEBERG_COMPAT_VERSION = version ))Aplica-se a:
Databricks SQL
Databricks Runtime 14.3 e versões posterioresEspecifica que a finalidade da reescrita de arquivo é atualizar a tabela para a versão do Apache Iceberg fornecida.
versiondeve ser1ou2.APPLY (CHECKPOINT)Aplica-se a:
Databricks Runtime 16.3 ou posteriorExecuta o ponto de verificação Delta na versão delta mais recente da tabela.
Exemplos
> REORG TABLE events APPLY (PURGE);
> REORG TABLE events WHERE date >= '2022-01-01' APPLY (PURGE);
> REORG TABLE events
WHERE date >= current_timestamp() - INTERVAL '1' DAY
APPLY (PURGE);
> REORG TABLE events APPLY (UPGRADE UNIFORM(ICEBERG_COMPAT_VERSION=2));
> REORG TABLE events APPLY (CHECKPOINT);