Partilhar via


Gerenciar o Azure Data Lake Analytics usando o portal do Azure

Importante

Novas contas do Azure Data Lake Analytics não podem mais ser criadas, a menos que sua assinatura tenha sido habilitada. Se precisar que a sua assinatura seja ativada , contacte o suporte e forneça o seu cenário de negócios.

Se você já estiver usando o Azure Data Lake Analytics, precisará criar um plano de migração de para o Azure Synapse Analytics para sua organização até 29 de fevereiro de 2024.

Este artigo descreve como gerenciar contas, fontes de dados, usuários e trabalhos do Azure Data Lake Analytics usando o portal do Azure.

Gerenciar contas do Data Lake Analytics

Criar uma conta

  1. Inicie sessão no portal Azure.
  2. Selecione Criar um recurso e procure Data Lake Analytics.
  3. Selecione valores para os seguintes itens:
    1. Nome: O nome da conta do Data Lake Analytics.
    2. Subscrição: A subscrição do Azure utilizada para a conta.
    3. Grupo de Recursos: O grupo de recursos do Azure no qual criar a conta.
    4. Localização: O datacenter do Azure para a conta do Data Lake Analytics.
    5. Repositório Data Lake: O repositório padrão a ser usado para a conta do Data Lake Analytics. A conta do Repositório Azure Data Lake e a conta do Data Lake Analytics devem estar no mesmo local.
  4. Selecione Criar.

Excluir uma conta do Data Lake Analytics

Antes de excluir uma conta do Data Lake Analytics, exclua sua conta padrão do Repositório Data Lake.

  1. No portal do Azure, vá para sua conta do Data Lake Analytics.
  2. Selecione Eliminar.
  3. Digite o nome da conta.
  4. Selecione Eliminar.

Gerir origens de dados

O Data Lake Analytics suporta as seguintes fontes de dados:

  • Repositório Data Lake
  • Armazenamento do Azure

Você pode usar o Data Explorer para procurar fontes de dados e executar operações básicas de gerenciamento de arquivos.

Adicionar uma fonte de dados

  1. No portal do Azure, vá para sua conta do Data Lake Analytics.

  2. Selecione Explorador de dados.

  3. Selecione Adicionar fonte de dados.

    • Para adicionar uma conta do Repositório Data Lake, você precisa do nome da conta e do acesso à conta para poder consultá-la.
    • Para adicionar o armazenamento de Blob do Azure, você precisa da conta de armazenamento e da chave da conta. Para encontrá-los, vá para a conta de armazenamento no portal e selecione Chaves de acesso.

Configurar regras de firewall

Você pode usar o Data Lake Analytics para reforçar ainda mais o bloqueio do acesso à sua conta do Data Lake Analytics ao nível da rede. Você pode habilitar um firewall, especificar um endereço IP ou definir um intervalo de endereços IP para seus clientes confiáveis. Depois de ativar estas medidas, apenas os clientes que têm os endereços IP dentro do intervalo definido podem conectar-se à loja.

Se outros serviços do Azure, como o Azure Data Factory ou VMs, se conectarem à conta do Data Lake Analytics, certifique-se de que a opção Permitir Serviços do Azure esteja definida para Ativado.

Configurar uma regra de firewall

  1. No portal do Azure, vá para sua conta do Data Lake Analytics.
  2. No menu à esquerda, selecione Firewall.

Adicionar um novo utilizador

Você pode usar o Assistente para Adicionar Usuário para criar facilmente novos usuários do Data Lake.

  1. No portal do Azure, vá para sua conta do Data Lake Analytics.
  2. À esquerda, sob Introdução, selecione Assistente para Adicionar Utilizador.
  3. Selecione um usuário e, em seguida, selecione Selecionar.
  4. Selecione uma função e, em seguida, selecione Selecionar. Para configurar um novo desenvolvedor para usar o Azure Data Lake, selecione a função Data Lake Analytics Developer.
  5. Selecione as listas de controle de acesso (ACLs) para os bancos de dados U-SQL. Quando estiver satisfeito com as suas escolhas, selecione Selecionar.
  6. Selecione as ACLs dos arquivos. Para o armazenamento padrão, não altere as ACLs para a pasta raiz "/" e para a pasta /system. Selecione Selecione.
  7. Reveja todas as alterações selecionadas e, em seguida, selecione Executar.
  8. Quando o assistente estiver concluído, selecione Concluído.

Gerir o controlo de acesso baseado em funções do Azure

Como outros serviços do Azure, você pode usar o controle de acesso baseado em função do Azure (Azure RBAC) para controlar como os usuários interagem com o serviço.

As funções padrão do Azure têm os seguintes recursos:

  • Proprietário: Pode enviar trabalhos, monitorar trabalhos, cancelar trabalhos de qualquer usuário e configurar a conta.
  • de Colaborador: pode enviar trabalhos, monitorizar trabalhos, cancelar trabalhos de qualquer utilizador e configurar a conta.
  • Reader: Pode monitorar trabalhos.

Use a função Desenvolvedor do Data Lake Analytics para permitir que os desenvolvedores U-SQL usem o serviço Data Lake Analytics. Você pode usar a função Desenvolvedor do Data Lake Analytics para:

  • Envie trabalhos.
  • Monitore o status do trabalho e o progresso dos trabalhos enviados por qualquer usuário.
  • Consulte os scripts U-SQL de trabalhos enviados por qualquer usuário.
  • Cancele apenas os seus próprios trabalhos.

Adicionar usuários ou grupos de segurança a uma conta do Data Lake Analytics

  1. No portal do Azure, vá para sua conta do Data Lake Analytics.

  2. Selecione Controlo de acesso (IAM) .

  3. Selecione Adicionar>Adicionar atribuição de função para abrir a Adicionar atribuição de função página.

  4. Atribua uma função a um usuário. Para obter etapas detalhadas, consulte Atribuir funções do Azure usando o portal do Azure.

    Captura de ecrã que mostra a página Adicionar atribuição de função no portal do Azure.

Observação

Se um usuário ou um grupo de segurança precisar enviar trabalhos, ele também precisará de permissão na conta da loja. Para obter mais informações, consulte Dados seguros armazenados no Repositório Data Lake.

Gerenciar trabalhos

Submeter um trabalho

  1. No portal do Azure, vá para sua conta do Data Lake Analytics.

  2. Selecione Novo Trabalho. Para cada trabalho, configure:

    1. Nome do trabalho: O nome do trabalho.
    2. Prioridade: Encontra-se em Mais opções. Números mais baixos têm maior prioridade. Se dois trabalhos estiverem na fila, aquele com menor valor de prioridade será executado primeiro.
    3. AUs: O número máximo de Unidades de Análise ou processos de computação a reservar para este trabalho.
    4. Runtime: Também em Mais opções. Selecione o tempo de execução padrão, a menos que você tenha recebido um tempo de execução personalizado.
  3. Adicione seu script.

  4. Selecione Enviar trabalho.

Monitorizar trabalhos

  1. No portal do Azure, vá para sua conta do Data Lake Analytics.
  2. Selecione Ver Todas as Vagas na parte superior da página. Uma lista de todos os trabalhos ativos e concluídos recentemente na conta é mostrada.
  3. Opcionalmente, selecione Filtro para ajudá-lo a encontrar os trabalhos por Intervalo de Tempo , Status , Nome do Trabalho , ID do Trabalho , Nome do Pipeline ou ID do Pipeline , Nome da Recorrência ou ID de Recorrência , e Autor .

Monitorização de tarefas de pipeline

Os trabalhos que fazem parte de um pipeline trabalham juntos, geralmente sequencialmente, para realizar um cenário específico. Por exemplo, você pode ter um pipeline que limpa, extrai, transforma e agrega o uso para insights dos clientes. Os trabalhos de pipeline são identificados usando a propriedade "Pipeline" quando a tarefa foi enviada. Os trabalhos agendados usando o ADF V2 terão essa propriedade preenchida automaticamente.

Para exibir uma lista de trabalhos U-SQL que fazem parte de pipelines:

  1. No portal do Azure, vá para suas contas do Data Lake Analytics.
  2. Selecione a opção Job Insights. A guia "Todos os trabalhos" será padronizada, mostrando uma lista de trabalhos em execução, enfileirados e encerrados.
  3. Selecione o separador Trabalhos de Pipeline. Uma lista de trabalhos de pipeline será mostrada juntamente com estatísticas agregadas para cada pipeline.

Monitoramento de trabalhos recorrentes

Um trabalho recorrente é aquele que tem a mesma lógica de negócios, mas usa dados de entrada diferentes toda vez que é executado. Idealmente, os trabalhos recorrentes devem sempre ter sucesso e ter um tempo de execução relativamente estável; Monitorar esses comportamentos ajudará a garantir que o trabalho seja saudável. Os trabalhos recorrentes são identificados usando a propriedade "Recorrência". Os trabalhos agendados usando o ADF V2 terão essa propriedade preenchida automaticamente.

Para exibir uma lista de trabalhos U-SQL recorrentes:

  1. No portal do Azure, vá para suas contas do Data Lake Analytics.
  2. Selecione a opção Job Insights. A guia "Todos os trabalhos" será padronizada, mostrando uma lista de trabalhos em execução, enfileirados e encerrados.
  3. Selecione a guia Trabalhos Recorrentes. Uma lista de trabalhos recorrentes será mostrada juntamente com estatísticas agregadas para cada trabalho recorrente.

Próximos passos