Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
Aplica-se a:
Databricks Runtime
Armazena em cache o conteúdo de uma tabela ou saída de uma consulta com o nível de armazenamento fornecido no cache do Apache Spark. Se uma consulta for armazenada em cache, uma exibição temporária será criada para essa consulta. Isso reduz a verificação dos arquivos originais para consultas futuras.
Observação
Os dados em cache são partilhados por todas as sessões Spark no cluster.
Sintaxe
CACHE [ LAZY ] TABLE table_name
[ OPTIONS ( 'storageLevel' [ = ] value ) ] [ [ AS ] query ]
Consulte Cache de disco versus cache Spark para saber as diferenças entre o cache de disco e o cache do Apache Spark.
Parâmetros
Preguiçoso
Armazene a tabela em cache apenas quando ela for usada pela primeira vez, em vez de imediatamente.
-
Identifica a tabela Delta ou a exibição a ser armazenada em cache. O nome não deve incluir uma especificação temporal ou uma especificação de opções. Se a tabela não puder ser encontrada, o Azure Databricks gerará um erro de TABLE_OR_VIEW_NOT_FOUND .
OPTIONS ( 'storageLevel' [ = ] valor )
OPTIONScláusula comstorageLevelpar chave e valor. Um aviso é emitido quando uma chave diferente destorageLevelé usada. As opções válidas parastorageLevelsão:NONEDISK_ONLYDISK_ONLY_2MEMORY_ONLYMEMORY_ONLY_2MEMORY_ONLY_SERMEMORY_ONLY_SER_2MEMORY_AND_DISKMEMORY_AND_DISK_2MEMORY_AND_DISK_SERMEMORY_AND_DISK_SER_2OFF_HEAP
Uma exceção é lançada quando um valor inválido é definido para
storageLevel. SestorageLevelnão for definido explicitamente usandoOPTIONScláusula, ostorageLevelpadrão será definido comoMEMORY_AND_DISK.consulta
Uma consulta que produz as linhas a serem armazenadas em cache. Pode ser em um dos seguintes formatos:
- Uma
SELECTdeclaração - Uma
TABLEdeclaração - Uma
FROMdeclaração
- Uma
Exemplos
> CACHE TABLE testCache OPTIONS ('storageLevel' 'DISK_ONLY') SELECT * FROM testData;