Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
O Data Wrangler acelera seu fluxo de trabalho de preparação de dados fornecendo uma interface visual imersiva para análise exploratória de dados. Neste artigo, você aprenderá a:
- Iniciar o Data Wrangler a partir do notebook Fabric
- Explorar dados com visualizações interativas e estatísticas de resumo
- Aplicar operações comuns de limpeza de dados com geração automática de código
- Exportar funções reutilizáveis de pandas ou PySpark de volta para seu notebook
Este artigo se concentra no Pandas DataFrames. Para DataFrames do Spark, consulte este recurso.
Pré-requisitos
Obtenha uma assinatura do Microsoft Fabric. Ou, inscreva-se para uma avaliação gratuita do Microsoft Fabric.
Entre no Microsoft Fabric.
Alterne para o Fabric usando o alternador de experiências no canto inferior esquerdo da página inicial.
Limitações
- Atualmente, as operações de código personalizadas dão suporte apenas a DataFrames Pandas.
- A exibição do Data Wrangler funciona melhor em monitores grandes. No entanto, você pode minimizar ou ocultar diferentes partes da interface para acomodar telas menores.
Como iniciar o Data Wrangler
Você pode iniciar o Data Wrangler diretamente de um notebook do Microsoft Fabric para explorar e transformar qualquer DataFrame do pandas ou do Spark.
Para começar a usar dados de exemplo:
Este snippet de código demonstra como realizar a leitura de dados de amostra em um DataFrame do Pandas:
import pandas as pd
# Read a CSV into a Pandas DataFrame
df = pd.read_csv("https://raw.githubusercontent.com/plotly/datasets/master/titanic.csv")
display(df)
Na guia "Página Inicial" da faixa de opções do notebook, use a lista suspensa Data Wrangler para navegar pelos DataFrames ativos do notebook disponíveis para edição. Selecione o que você deseja abrir no Data Wrangler.
Dica
Você não pode abrir o Data Wrangler enquanto o kernel do notebook está ocupado. Uma célula em execução deve ser concluída antes que o Data Wrangler possa ser iniciado, conforme mostrado nesta captura de tela:
Como escolher exemplos personalizados
Para abrir um exemplo personalizado de qualquer DataFrame ativo com o Data Wrangler, selecione Escolher exemplo personalizado na lista suspensa, conforme mostrado nesta captura de tela:
Essa ação abre uma caixa de diálogo com opções para especificar o tamanho da amostra desejada (número de linhas) e o método de amostragem (primeiros registros, últimos registros ou um conjunto aleatório). As primeiras 5 mil linhas do DataFrame servem como o tamanho padrão da amostra, conforme mostrado nesta captura de tela:
Exibindo estatísticas de resumo
Quando o Data Wrangler é carregado, ele exibe uma visão geral descritiva do DataFrame escolhido no painel Resumo . Essa visão geral inclui informações sobre as dimensões dataframe, valores ausentes e muito mais. Quando você seleciona qualquer coluna na grade do Data Wrangler, o painel Resumo é atualizado para exibir estatísticas descritivas sobre essa coluna específica. Insights rápidos sobre cada coluna também estão disponíveis em seu cabeçalho.
Dica
As estatísticas e visuais específicos da coluna (no painel Resumo e nos cabeçalhos de coluna) dependem do tipo de dados da coluna. Por exemplo, um histograma com compartimento de uma coluna numérica aparece no cabeçalho da coluna somente se a coluna estiver convertida como um tipo numérico, conforme mostrado nesta captura de tela:
Operações de limpeza de dados de navegação
O painel Operações fornece uma lista pesquisável de operações de limpeza de dados. Ao selecionar uma operação de limpeza de dados no painel Operações , você precisará fornecer uma coluna ou coluna de destino, juntamente com todos os parâmetros necessários para concluir a operação. Por exemplo, a solicitação para escalar numericamente uma coluna requer um novo intervalo de valores, conforme mostrado nesta captura de tela:
Dica
É possível aplicar uma seleção reduzida de operações usando o menu de cada cabeçalho de coluna, como mostrado nesta captura de tela:
Visualizar e aplicar operações
A grade de exibição do Data Wrangler realiza uma pré-visualização automática dos resultados de uma operação selecionada, e o código correspondente aparece automaticamente no painel abaixo da grade. Para confirmar o código visualizado, selecione Aplicar em qualquer local. Para excluir o código visualizado e tentar uma nova operação, selecione Descartar , conforme mostrado nesta captura de tela:
Depois de aplicar uma operação, a grade de exibição do Data Wrangler e as estatísticas resumidas são atualizadas para refletir os resultados. O código aparece na lista de operações confirmadas em execução no painel Etapas de Limpeza, conforme mostrado nesta captura de tela.
Dica
É possível desfazer a última etapa aplicada a qualquer momento.. No painel Etapas de Limpeza , um ícone de lixeira aparece quando você passa o cursor sobre a etapa aplicada mais recentemente, conforme mostrado nesta captura de tela:
Esta tabela faz um resumo das operações com suporte por parte do Data Wrangler atualmente:
| Operação | Descrição |
|---|---|
| Sort | Classificar uma coluna em ordem crescente ou decrescente |
| Filter | Filtrar linhas com base em uma ou mais condições |
| Codificação One-Hot | Criar novas colunas para cada valor exclusivo em uma coluna existente, indicando a presença ou ausência desses valores por linha |
| Binarizador de múltiplos rótulos | Dividir dados usando um separador e criar novas colunas para cada categoria, marcando 1 se uma linha tiver essa categoria e 0 se não tiver |
| Alterar tipo de coluna | Alterar o tipo de dados de uma coluna |
| Soltar coluna | Exclua uma ou mais colunas |
| Selecionar coluna | Escolher uma ou mais colunas para manter e excluir o restante |
| Renomear coluna | Renomear uma coluna |
| Descartar valores ausentes | Remover linhas com valores ausentes |
| Soltar linhas duplicadas | Remover todas as linhas que têm valores duplicados em uma ou mais colunas |
| Preencher valores ausentes | Substituir células por valores ausentes por um novo valor |
| Localizar e substituir | Substituir células por um padrão de correspondência exato |
| Agrupar por coluna e agregação | Agrupar por valores de coluna e resultados agregados |
| Remover espaço em branco | Remover espaço em branco do início e do fim do texto |
| Dividir o texto | Dividir uma coluna em várias colunas com base em um delimitador definido pelo usuário |
| Converter texto em minúsculas | Converter texto em minúsculas |
| Converter texto em maiúsculas | Converter texto em MAIÚSCULAS |
| Valores mín./máx. da escala | Dimensionar uma coluna numérica entre um valor mínimo e máximo |
| Preenchimento relâmpago | Criar automaticamente uma nova coluna com base em exemplos derivados de uma coluna existente |
Personalizar sua exibição
A qualquer momento, você pode personalizar a interface usando a guia "Exibições" na barra de ferramentas acima da grade de exibição do Data Wrangler. Essa opção pode ocultar ou mostrar painéis diferentes com base em suas preferências e tamanho de tela, conforme mostrado nesta captura de tela:
Salvar e exportar código
A barra de ferramentas acima da grade de exibição do Data Wrangler fornece opções para salvar o código gerado. Você pode copiar o código para a área de transferência ou exportá-lo diretamente para o notebook como uma função. Exportar o código fecha o Data Wrangler e adiciona a nova função a uma célula de código no notebook. Você também pode baixar o DataFrame limpo como um arquivo CSV.
Dica
O Data Wrangler gera um código que é executado somente quando você executa manualmente a nova célula e não substitui o DataFrame original, conforme mostrado nesta captura de tela:
Em seguida, você pode realizar a execução do código exportado, conforme mostrado nesta captura de tela:
Próximas etapas
Agora que você sabe como usar o Data Wrangler com o Pandas DataFrames, explore estes recursos:
- Usar o Data Wrangler com DataFrames do Spark – Aplicar as mesmas técnicas ao Spark DataFrames
- Assistir a uma demonstração ao vivo – Veja o Data Wrangler em ação com Guy in a Cube
- Experimentar o Wrangler de Dados no VS Code – Usar o Wrangler de Dados no Visual Studio Code
Deseja fazer comentários? Compartilhe suas ideias no fórum Ideias do Fabric.