Partilhar via


Use o Agente de Ciência de Dados

Importante

Este recurso está no Public Preview.

Esta página apresenta o Data Science Agent, um agente de dados de IA disponível selecionando Modo de agente no Assistente de Databricks. Projetado especificamente para notebooks Databricks e o Editor SQL, ele explora dados, gera e executa código e corrige erros — tudo a partir de um único prompt.

O que é o Agente de Ciência de Dados?

O Agente de Ciência de Dados é um recurso poderoso no Modo de Agente do Assistente Databricks que transforma o Assistente em um companheiro inteligente que pode automatizar fluxos de trabalho inteiros de ciência de dados em várias etapas em notebooks Databricks e no Editor SQL.

Use o Agente de Ciência de Dados em um bloco de anotações.

Em comparação com o modo de Chat Assistente, o modo Agente expandiu os recursos: planejamento de uma solução, recuperação de ativos relevantes, execução de código, uso de saídas de célula para melhorar os resultados, correção automática de erros e muito mais.

O Data Science Agent pode planejar e gerar código para ser executado em blocos de anotações ou consultas para executar no editor SQL. O Agente trabalha com você para aprovar seus planos e confirmar suas próximas etapas antes de prosseguir. Com sua aprovação, o Agente de Ciência de Dados pode usar ferramentas para executar tarefas como pesquisar tabelas, editar um bloco de anotações, executar células e ler saídas de células.

O acesso e as ações do Agente de Ciência de Dados são regidos pelas permissões do usuário. Ele só pode acessar dados aos quais você tem acesso e executar operações para as quais você tem permissões.

Requerimentos

Para usar o Agente de Ciência de Dados, seu espaço de trabalho precisa do seguinte:

Use o Agente de Ciência de Dados

Para usar o Agente de Ciência de Dados:

  1. Em um bloco de anotações Databricks ou no Editor SQL, abra o painel lateral Assistente.

  2. No canto inferior direito, selecione Agente. Isso ativa o modo Agente do Assistente, permitindo que você interaja com o Agente de Ciência de Dados.

    Agente de Ciência de Dados Abertos

  3. Insira um prompt para o Agente. Por exemplo, "Analise @sales_transactions a partir de samples.bakehouse para identificar o produto mais vendido."

    Sugestão

    Faça referência a tabelas específicas usando @table_name. O agente usará essa tabela e quaisquer metadados associados para organizar sua resposta. O agente respeita as permissões do Catálogo Unity do usuário, portanto, ele só pode acessar os dados aos quais você tem acesso.

  4. À medida que o Agente gera sua resposta, ele geralmente pausa para obter sua entrada:

    • Para tarefas mais complexas, o agente pode criar um plano passo-a-passo e fazer perguntas esclarecedoras. Responda às perguntas esclarecedoras do Agente para ajudá-lo a aprimorar seu plano.

    • Quando o Agente precisa executar o código, ele pede sua aprovação antes de prosseguir. Permitir ou Recusar sua solicitação. Você também pode selecionar Permitir neste thread (referindo-se ao thread de conversa do Assistente) ou Sempre permitir.

      Importante

      O Agente de Ciência de Dados pode gerar e executar código no seu bloco de anotações. Embora tenha guarda-corpos para evitar ações perigosas, ainda há risco. Você só deve usá-lo com código e dados em que confia

    • À medida que o agente continua seu trabalho, você pode ser solicitado a selecionar Continuar ou Rejeitar. Revise o trabalho existente do Agente e selecione Continuar para permitir que o Agente continue para suas próximas etapas ou Rejeitar para dizer a ele para tentar outra coisa.

    • Para parar o Agente enquanto ele está funcionando, clique no ícone vermelho Parar..

O Agente pode criar novas células (ou consultas) do bloco de notas, gerar texto e código, executar as células do bloco de notas e aceder à saída da célula para interpretar os resultados.

Observação

Para que o Agente de Ciência de Dados continue seu trabalho e siga as próximas etapas, você precisa permanecer na guia atual em que o Agente está trabalhando.

Casos de uso

No modo Agente, o Assistente tem recursos expandidos, como localizar dados, interpretar saídas e executar ações de célula.

O Agente de Ciência de Dados pode ajudar com tarefas complexas de ciência de dados, incluindo análise exploratória de dados, previsão e aprendizado de máquina. Você pode até mesmo usar a criação de um novo bloco de anotações de análise de dados do zero com o Agente de Ciência de Dados. Para obter melhores resultados, forneça contexto ao agente fazendo referência a tabelas e pipelines com @<resource_name>. Você também pode clicar no ícone At. Recursos de referência para selecionar manualmente o contexto a ser fornecido.

Tente as seguintes instruções para começar:

  • Descoberta de dados:
    • "Qual tabela contém dados de transação de bakehouse?"
    • "Quero ver os dados meteorológicos para a data 2025-01-01 na cidade de Los Angeles, CA."
    • "Encontre uma tabela que contenha dados de táxi da cidade de Nova York e me mostre as primeiras 10 linhas."
  • Análise exploratória dos dados:
    • "Ajude-me a analisar a cadeia de caracteres JSON na coluna A."
    • "Crie uma visualização dos dados desta tabela."
    • "Interprete este gráfico de barras."
    • "Descreva o conjunto de @sales_transactions dados. Execute alguns EDA para me ajudar a entender as estatísticas da coluna e visualizar a distribuição dos valores. Pense como um cientista de dados."
    • "Analise @workload_insights para encontrar os 5 principais clientes para cargas de trabalho Databricks SQL na semana passada por receita. Em seguida, plote quantos usuários esses clientes tiveram para o Databricks SQL por semana nas últimas 6 semanas."
  • Previsão:
    • "Usando o @incidents conjunto de dados, construa uma previsão do número diário de incidentes para as próximas 2 semanas. Quando terminar, dê-me uma tabela de dados e um gráfico interativo para exibir os resultados."
    • "Usando o @website_traffic conjunto de dados, preveja a contagem diária de visitantes para o próximo mês. Destaque quaisquer padrões sazonais."
    • "Gere uma previsão da demanda de produtos para os próximos 6 meses a @inventory partir do conjunto de dados, incluindo intervalos de confiança."
  • Aprendizagem automática:
    • "Execute alguma preparação de dados e engenharia de recursos para preparar esse conjunto de dados para treinamento de modelos."
    • "Treine um modelo de classificação no conjunto de dados para prever a @customer_data rotatividade. Avalie o modelo com precisão e métricas AUC."
    • "Execute o ajuste de hiperparâmetros em um modelo de regressão usando o conjunto de dados para melhorar o @housing_prices erro de previsão."
    • "Crie um modelo de clustering no @sales_leads conjunto de dados para identificar segmentos de clientes e fornecer um resumo das características de cada cluster."
  • Organização do bloco de notas:
    • "Crie uma nova célula que resuma os resultados deste bloco de notas."
    • "Dê a este caderno um nome relevante."

Análise exploratória de dados

Use o Data Science Agent para executar a análise exploratória de dados em um conjunto de dados. Por exemplo, tente usar o Agente para ajudá-lo a criar um novo bloco de anotações que analise o samples.bakehouse.sales_transactions conjunto de dados.

Em uma guia vazia do bloco de anotações, abra o painel Assistente, selecione Modo de agente e digite o seguinte prompt: "Descreva o conjunto de dados, @sales_transactions de samples.bakehouse. Quero fazer alguns EDA para que eu possa entender as estatísticas da coluna e visualizar a distribuição dos valores. Pense como um cientista de dados."

O Data Science Agent cria um notebook para EDA.

O agente cria um plano para responder ao seu pedido e pode fazer perguntas esclarecedoras. Com a sua aprovação, gera novas células de bloco de notas que incluem código para explorar os dados e texto que explica o seu processo e descobertas.