Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Este artigo explica como usar marcas para atribuir o uso de computação a workspaces, equipes, projetos ou usuários específicos para dar suporte ao controle de custos e ao orçamento.
Há dois tipos de marcas:
- Marcas padrão: aplicadas automaticamente pelo Databricks aos recursos implantados na nuvem. Eles fornecem metadados básicos, como fornecedor, ID de cluster e criador.
- Marcas personalizadas: marcas definidas pelo usuário que você pode adicionar a recursos de computação e cargas de trabalho sem servidor. Elas permitem acompanhamento granular, relatórios e orçamento.
Aviso
Os dados da etiqueta são armazenados como texto simples e podem ser replicados globalmente. Não use nomes de marca, valores ou descritores que possam comprometer a segurança de seus recursos. Por exemplo, não use nomes de marca, valores ou descritores que contenham informações pessoais ou confidenciais.
Marcas padrão
O Azure Databricks adiciona automaticamente marcas padrão aos recursos de computação implantados em sua conta de nuvem. Essas marcas atribuem o uso ao Databricks e fornecem informações básicas sobre o recurso, como seu nome, ID e criador.
As marcas padrão são propagadas automaticamente para relatórios de análise de custos detalhados que você pode acessar no portal do Azure.
Aqui está um relatório de detalhes da fatura de análise de custos no portal do Azure que detalha o custo por marca clusterid em um período de um mês:
Chaves e valores padrão de tag
O Azure Databricks adiciona as seguintes marcas padrão aos recursos de computação:
| Chave da marca | Valor |
|---|---|
Vendor |
Valor constante: Databricks |
ClusterId |
ID interna do cluster no Azure Databricks |
ClusterName |
Nome do cluster |
Creator |
Nome de usuário (endereço de email) do usuário que criou o cluster |
RunName |
Nome do trabalho (só se propaga na computação de trabalhos). Se você usar a API de Jobs 2.0, é equivalente a run_name. Na API de Trabalhos 2.1, é a task_key. |
JobId |
ID do trabalho (só se propaga na computação de trabalhos) |
A computação usada pela criação de perfil de dados inclui estas marcas adicionais:
| Chave da marca | Valor |
|---|---|
LakehouseMonitoring |
verdadeiro |
LakehouseMonitoringTableId |
ID da tabela monitorada |
LakehouseMonitoringWorkspaceId |
ID do workspace em que o monitor foi criado |
LakehouseMonitoringMetastoreId |
ID do metastore em que a tabela monitorada existe |
O Azure Databricks adiciona as seguintes marcas padrão aos pools e aos recursos de computação criados por pools.
| Chave da marca | Valor |
|---|---|
Vendor |
Valor constante: Databricks |
DatabricksInstancePoolCreatorId |
ID interna do Azure Databricks do usuário que criou o pool |
DatabricksInstancePoolId |
ID interna do Azure Databricks do pool |
Tags personalizadas
As marcas personalizadas permitem atribuir o uso de computação a equipes, projetos ou centros de custo específicos com mais granularidade do que as marcas padrão. Essas tags são aplicadas por usuários ou administradores e propagam-se tanto para os logs de uso da sua conta quanto para os recursos de nuvem aplicáveis. Essas tags também são usadas para criar e monitorar orçamentos na sua conta do Azure Databricks.
Recursos com suporte para etiquetas personalizadas
| Objeto | Interface do usuário de marcação | Interface de marcação (API) |
|---|---|---|
| Espaço de trabalho | Portal do Azure | API de Recursos do Azure |
| piscina | Interface do usuário de pools no workspace do Azure Databricks | API do pool de instâncias |
| Computação de trabalho e para todos os fins | Interface do usuário de computação no workspace do Azure Databricks | API de Clusters |
| SQL Warehouse | Interface do usuário do SQL warehouse no workspace do Azure Databricks | API de warehouses |
| Instância do banco de dados | Interface da instância de banco de dados no workspace do Azure Databricks | API de instâncias de banco de dados |
As marcas personalizadas aparecem em letras minúsculas nos logs do GCE. Os caracteres serão removidos se não forem letras, números, sublinhados ou traços. Por exemplo, My Key torna-se mykey e My.Val torna-se myval.
Aviso
Não atribua uma etiqueta personalizada com a chave Name a um cluster. Cada cluster tem uma marca Name cujo valor é definido pelo Azure Databricks. Se você alterar o valor associado à chave Name, o cluster não poderá mais ser acompanhado pelo Azure Databricks. Como consequência, o cluster pode não ser encerrado depois de ficar ocioso e continuará a incorrer em custos de uso.
Marcar cargas de trabalho de computação sem servidor
Importante
Esse recurso está em uma visualização pública.
Para atribuir o uso de computação sem servidor a usuários, grupos ou projetos, você pode usar políticas de orçamento sem servidor. Quando um usuário recebe uma política de orçamento sem servidor, seu uso sem servidor é automaticamente marcado com as marcas personalizadas da política. As políticas de orçamento sem servidor podem ser aplicadas a notebooks sem servidor, trabalhos, pipelines e pontos de extremidade de serviço de modelo.
Observação
O uso de computação sem servidor é registrado na tabela do sistema de uso faturável da sua conta. Os relatórios de uso de DBU herdados não incluem marcas de política de orçamento sem servidor ou de uso sem servidor.
Consulte o uso de atributos com políticas de orçamento sem servidor.
Propagação de etiquetas
As etiquetas de workspace, pool e cluster são agregadas pelo Azure Databricks e propagadas para as VMs do Azure para relatórios de análise de custo. Mas as marcas de pool e cluster são propagadas de forma diferente entre si.
As marcas de pool e workspace são agregadas e atribuídas como marcas de recurso das VMs do Azure que hospedam os pools.
As marcas de cluster e workspace são agregadas e atribuídas como marcas de recurso das VMs do Azure que hospedam os clusters.
Quando clusters são criados a partir de pools, somente as etiquetas de workspace e as etiquetas de pool são propagadas para as VMs. As marcas de cluster não são propagadas para preservar o desempenho de inicialização do cluster de pool.
Resolução de conflitos de marcas
Quando uma marca personalizada (marca de workspace, cluster ou pool) tem o mesmo nome de chave que uma marca padrão do Azure Databricks, essa marca personalizada é automaticamente prefixada com x_ durante a propagação. A tag padrão do Azure Databricks mantém seu nome de chave original.
Por exemplo, o Azure Databricks aplica uma marca vendor = Databricks de cluster padrão a todos os clusters. Se você adicionar uma marca de workspace personalizada vendor = Azure Databricks, isso entrará em conflito com a marca padrão vendor. Quando propagada para o Azure, a marca de workspace personalizada se torna x_vendor = Azure Databricks, enquanto a marca padrão do Azure Databricks permanece como vendor = Databricks.
Aviso
Tags personalizadas conflitantes adicionadas por meio de políticas de computação não podem ser resolvidas, resultando na falha do cluster ou pool com um erro de configuração inválida. Verifique se as políticas de computação não adicionam nomes de marca conflitantes.
:::
Imposição de marca
Para impor o uso de marcas personalizadas específicas, você pode usar políticas de processamento. Confira Imposição de marca personalizada. Para impor tags personalizadas em trabalhos de computação sem servidor, use políticas de orçamento sem servidor.
Limitações
- Pode levar até uma hora para que as tags de espaço de trabalho personalizadas sejam propagadas para o Azure Databricks após qualquer alteração.
- No máximo, 50 marcas podem ser atribuídas a um recurso do Azure. Se a contagem geral de marcas agregadas exceder esse limite, as marcas prefixadas com
x_serão avaliadas em ordem alfabética e aquelas que excederem o limite serão ignoradas. Se todas as marcas prefixadas comx_forem ignoradas e a contagem estiver acima do limite, as marcas restantes serão avaliadas em ordem alfabética e aquelas que excederem o limite serão ignoradas. - As chaves e valores de tag só podem conter letras, espaços, números ou os caracteres
+,-,=,._,:, ,/, .@As tags que contêm outros caracteres são inválidas. - Se você alterar os nomes ou os valores de chave de marca, essas alterações serão aplicadas somente após a reinicialização do cluster ou a expansão do pool.
- Se as marcas personalizadas do cluster entrarem em conflito com as marcas personalizadas de um pool, o cluster não poderá ser criado.
- Tags de workspace recém-adicionadas, modificadas ou excluídas não são disseminadas automaticamente para os recursos de computação existentes. Para propagar novas tags, abra a página de detalhes do recurso de computação, clique em Editar e, em seguida, Confirmar e reiniciar.