Partilhar via


Ingire dados no seu armazém usando pipelines

Aplica-se a:✅ Armazém de Dados no Microsoft Fabric

Neste artigo, aprende como usar a atividade de tarefa de cópia dos pipelines do Data Factory.

  • Os pipelines oferecem uma alternativa ao uso do comando COPY através de uma interface gráfica.
  • Um pipeline é um agrupamento lógico de atividades que, juntas, executam uma tarefa de ingestão de dados.
  • Os pipelines permitem-lhe gerir todas as atividades de extração, transformação e carregamento (ETL) num só local, em vez de gerir cada uma individualmente.

Nota

Algumas funcionalidades do Azure Data Factory não estão disponíveis no Microsoft Fabric. No entanto, os conceitos são intercambiáveis. Pode aprender mais sobre Azure Data Factory e pipelines em Pipelines e atividades em Azure Data Factory e Azure Synapse Analytics. Para um início rápido, veja Início Rápido: Crie o seu primeiro pipeline para copiar dados.

Criar um trabalho de cópia

Para criar um novo trabalho de cópia, siga estes passos.

  1. No ecrã inicial do seu espaço de trabalho, selecione o botão + Novo item . Na secção Obter dados , selecione Copiar trabalho.

  2. No diálogo Nova cópia de trabalho, introduza um nome para o seu novo pipeline e selecione Criar. A nova janela Cópia de trabalho é aberta.

  3. Escolha a sua fonte de dados do catálogo OneLake.

  4. Na página Escolher dados , pré-visualize o conjunto de dados selecionado. Depois de rever os dados, selecione Próximo.

  5. Na página Escolher destino de dados , selecione o armazém desejado no catálogo OneLake.

  6. A página Escolher o modo de cópia do trabalho permite-lhe configurar como quer que os dados sejam copiados: uma cópia completa ou cópias incrementais que realizam apenas cópias subsequentes quando os dados de origem mudam.

    Por agora, selecione Cópia Completa. Para outras fontes de dados e cenários, podes carregar os dados de forma incremental à medida que a fonte de dados é atualizada.

  7. Pode ajustar as tabelas de Destino com o nome do esquema de destino desejado e o nome da tabela. Forneça nomes de esquemas e tabelas que correspondam à convenção de nomes desejada. Quando terminares de fazer alterações, seleciona Próximo.

    Captura de ecrã da página Mapa para destino da janela Copiar trabalho. O destino é dbo. NYC_taxi.

  8. Opcionalmente, para modificar os mapeamentos das colunas, selecione Editar mapeamento de colunas. Pode mapear nomes de colunas de origem para novos nomes, tipos de dados ou saltar colunas de origem.

    Captura de ecrã a mostrar as opções para carregar dados para uma tabela existente ou para criar uma nova.

    Quando terminares de rever os mapeamentos das colunas, seleciona Próximo.

  9. A página Revisar + guardar é um resumo da nova tarefa de cópia.

    Revise o resumo e as opções, depois selecione Guardar + Executar.

  10. Você é encaminhado para a área de canvas do pipeline, onde já está configurada uma nova atividade de cópia com a sua Fonte e Destino. Se selecionou Iniciar transferência de dados imediatamente na página anterior, o trabalho de cópia começa assim que está pronto para executar.

  11. Pode monitorizar o estado do seu pipeline no painel de Resultados .

  12. Após alguns segundos, o seu pipeline é concluído com êxito. Quando regressar ao seu armazém, pode selecionar a sua tabela para pré-visualizar os dados e confirmar que a operação de cópia terminou.

Próximo passo

Opções de ingestão de dados

Outras formas de ingerir dados no seu armazém incluem: