Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
Esta página apresenta o Data Science Agent, um agente de dados de IA disponível selecionando Modo de agente no Assistente de Databricks. Projetado especificamente para notebooks Databricks e o Editor SQL, ele explora dados, gera e executa código e corrige erros — tudo a partir de um único prompt.
O que é o Agente de Ciência de Dados?
O Agente de Ciência de Dados é um recurso poderoso no Modo de Agente do Assistente Databricks que transforma o Assistente em um companheiro inteligente que pode automatizar fluxos de trabalho inteiros de ciência de dados em várias etapas em notebooks Databricks e no Editor SQL.
Em comparação com o modo de Chat Assistente, o modo Agente expandiu os recursos: planejamento de uma solução, recuperação de ativos relevantes, execução de código, uso de saídas de célula para melhorar os resultados, correção automática de erros e muito mais.
O Data Science Agent pode planejar e gerar código para ser executado em blocos de anotações ou consultas para executar no editor SQL. O Agente trabalha com você para aprovar seus planos e confirmar suas próximas etapas antes de prosseguir. Com sua aprovação, o Agente de Ciência de Dados pode usar ferramentas para executar tarefas como pesquisar tabelas, editar um bloco de anotações, executar células e ler saídas de células.
O acesso e as ações do Agente de Ciência de Dados são regidos pelas permissões do usuário. Ele só pode acessar dados aos quais você tem acesso e executar operações para as quais você tem permissões.
Requerimentos
Para usar o Agente de Ciência de Dados, seu espaço de trabalho precisa do seguinte:
- Recursos de IA baseados em parceiros habilitados para a conta e o espaço de trabalho. Consulte Funcionalidades de IA potenciadas por parceiros.
- Vista prévia do modo Agente do Assistente Databricks ativada. Consulte Gerenciar visualizações do Azure Databricks.
Use o Agente de Ciência de Dados
Para usar o Agente de Ciência de Dados:
Em um bloco de anotações Databricks ou no Editor SQL, abra o painel lateral Assistente.
No canto inferior direito, selecione Agente. Isso ativa o modo Agente do Assistente, permitindo que você interaja com o Agente de Ciência de Dados.
Insira um prompt para o Agente. Por exemplo, "Analise
@sales_transactionsa partir de samples.bakehouse para identificar o produto mais vendido."Sugestão
Faça referência a tabelas específicas usando
@table_name. O agente usará essa tabela e quaisquer metadados associados para organizar sua resposta. O agente respeita as permissões do Catálogo Unity do usuário, portanto, ele só pode acessar os dados aos quais você tem acesso.À medida que o Agente gera sua resposta, ele geralmente pausa para obter sua entrada:
Para tarefas mais complexas, o agente pode criar um plano passo-a-passo e fazer perguntas esclarecedoras. Responda às perguntas esclarecedoras do Agente para ajudá-lo a aprimorar seu plano.
Quando o Agente precisa executar o código, ele pede sua aprovação antes de prosseguir. Permitir ou Recusar sua solicitação. Você também pode selecionar Permitir neste thread (referindo-se ao thread de conversa do Assistente) ou Sempre permitir.
Importante
O Agente de Ciência de Dados pode gerar e executar código no seu bloco de anotações. Embora tenha guarda-corpos para evitar ações perigosas, ainda há risco. Você só deve usá-lo com código e dados em que confia
À medida que o agente continua seu trabalho, você pode ser solicitado a selecionar Continuar ou Rejeitar. Revise o trabalho existente do Agente e selecione Continuar para permitir que o Agente continue para suas próximas etapas ou Rejeitar para dizer a ele para tentar outra coisa.
Para parar o Agente enquanto ele está funcionando, clique no ícone vermelho
.
O Agente pode criar novas células (ou consultas) do bloco de notas, gerar texto e código, executar as células do bloco de notas e aceder à saída da célula para interpretar os resultados.
Observação
Para que o Agente de Ciência de Dados continue seu trabalho e siga as próximas etapas, você precisa permanecer na guia atual em que o Agente está trabalhando.
Casos de uso
No modo Agente, o Assistente tem recursos expandidos, como localizar dados, interpretar saídas e executar ações de célula.
O Agente de Ciência de Dados pode ajudar com tarefas complexas de ciência de dados, incluindo análise exploratória de dados, previsão e aprendizado de máquina. Você pode até mesmo usar a criação de um novo bloco de anotações de análise de dados do zero com o Agente de Ciência de Dados. Para obter melhores resultados, forneça contexto ao agente fazendo referência a tabelas e pipelines com @<resource_name>. Você também pode clicar no Recursos de referência para selecionar manualmente o contexto a ser fornecido.
Tente as seguintes instruções para começar:
-
Descoberta de dados:
- "Qual tabela contém dados de transação de bakehouse?"
- "Quero ver os dados meteorológicos para a data 2025-01-01 na cidade de Los Angeles, CA."
- "Encontre uma tabela que contenha dados de táxi da cidade de Nova York e me mostre as primeiras 10 linhas."
-
Análise exploratória dos dados:
- "Ajude-me a analisar a cadeia de caracteres JSON na coluna A."
- "Crie uma visualização dos dados desta tabela."
- "Interprete este gráfico de barras."
- "Descreva o conjunto de
@sales_transactionsdados. Execute alguns EDA para me ajudar a entender as estatísticas da coluna e visualizar a distribuição dos valores. Pense como um cientista de dados." - "Analise
@workload_insightspara encontrar os 5 principais clientes para cargas de trabalho Databricks SQL na semana passada por receita. Em seguida, plote quantos usuários esses clientes tiveram para o Databricks SQL por semana nas últimas 6 semanas."
-
Previsão:
- "Usando o
@incidentsconjunto de dados, construa uma previsão do número diário de incidentes para as próximas 2 semanas. Quando terminar, dê-me uma tabela de dados e um gráfico interativo para exibir os resultados." - "Usando o
@website_trafficconjunto de dados, preveja a contagem diária de visitantes para o próximo mês. Destaque quaisquer padrões sazonais." - "Gere uma previsão da demanda de produtos para os próximos 6 meses a
@inventorypartir do conjunto de dados, incluindo intervalos de confiança."
- "Usando o
-
Aprendizagem automática:
- "Execute alguma preparação de dados e engenharia de recursos para preparar esse conjunto de dados para treinamento de modelos."
- "Treine um modelo de classificação no conjunto de dados para prever a
@customer_datarotatividade. Avalie o modelo com precisão e métricas AUC." - "Execute o ajuste de hiperparâmetros em um modelo de regressão usando o conjunto de dados para melhorar o
@housing_priceserro de previsão." - "Crie um modelo de clustering no
@sales_leadsconjunto de dados para identificar segmentos de clientes e fornecer um resumo das características de cada cluster."
-
Organização do bloco de notas:
- "Crie uma nova célula que resuma os resultados deste bloco de notas."
- "Dê a este caderno um nome relevante."
Análise exploratória de dados
Use o Data Science Agent para executar a análise exploratória de dados em um conjunto de dados. Por exemplo, tente usar o Agente para ajudá-lo a criar um novo bloco de anotações que analise o samples.bakehouse.sales_transactions conjunto de dados.
Em uma guia vazia do bloco de anotações, abra o painel Assistente, selecione Modo de agente e digite o seguinte prompt: "Descreva o conjunto de dados, @sales_transactions de samples.bakehouse. Quero fazer alguns EDA para que eu possa entender as estatísticas da coluna e visualizar a distribuição dos valores. Pense como um cientista de dados."
O agente cria um plano para responder ao seu pedido e pode fazer perguntas esclarecedoras. Com a sua aprovação, gera novas células de bloco de notas que incluem código para explorar os dados e texto que explica o seu processo e descobertas.