Compartilhar via


Conectar-se à Nuvem de Produtividade de Dados do Matillion

O Matillion Data Productivity Cloud é uma ferramenta ETL/ELT criada especificamente para plataformas de banco de dados de nuvem, incluindo o Azure Databricks. O Matillion Data Productivity Cloud tem uma interface de usuário moderna baseada em navegador, com funcionalidade poderosa de ETL/ELT push-down.

Você pode integrar os SQL warehouses do Databricks (antigos pontos de extremidade de SQL do Databricks) e os clusters do Azure Databricks ao Matillion.

Conectar-se ao Matillion usando o Partner Connect

Esta seção descreve como usar o Partner Connect para simplificar o processo de conexão de um warehouse ou cluster de SQL existente em seu workspace do Azure Databricks ao Matillion.

Requisitos

Confira os requisitos para usar o Partner Connect.

Etapas para se conectar

Para se conectar ao Matillion usando o Partner Connect, siga as etapas nesta seção.

  1. Na barra lateral, clique em Ícone do MarketplaceMarketplace.

  2. Em integrações do Partner Connect, clique em Exibir tudo.

  3. Clique no tile Matillion Data Productivity Cloud.

  4. Selecione um catálogo do Azure Databricks para Matillion gravar e clicar em Avançar.

  5. Selecione um Databricks SQL Warehouse existente para usar com Matillion. Esse recurso de computação é usado para executar seus pipelines.

  6. Escolha o esquema que o Matillion deve usar para criar e gerenciar seus pipelines de dados. Clique em Adicionar.

  7. Clique em Próximo.

  8. Examine as informações de conexão e clique em Avançar.

  9. Examine e aceite os termos e condições para usar o Partner Connect e clique em Conectar-se ao Matillion Data Productivity Cloud.

  10. A página da Matillion Data Productivity Cloud é carregada. Conclua as instruções na tela para criar sua conta de avaliação de 14 dias ou entrar em sua conta existente do Matillion.

    O Matillion pode levar alguns minutos para criar a infraestrutura necessária e se conectar com segurança ao seu ambiente do Azure Databricks.

  11. Depois que o Matillion concluir o processo de instalação, o Designer carrega.

    Observação

    Se você não estiver na página Designer, volte para o Azure Databricks e entre no Matillion novamente.

Introdução ao Matillion

Depois que a instalação for concluída, você entrará no Designer, onde poderá iniciar a criação de pipelines de dados. Pipelines são a maneira da Nuvem de Produtividade de Dados de projetar, organizar e executar fluxos de trabalho.

Para garantir que o workspace do Azure Databricks esteja conectado ao Matillion, procure o seguinte:

  • Um projeto padrão com o logotipo do Azure Databricks no canto superior esquerdo.
  • Seu ambiente é nomeado usando a terminologia do Azure Databricks.
  • Se você clicar em Esquemas no canto superior esquerdo, um painel será aberto e mostrará seu esquema selecionado no Azure Databricks, juntamente com tabelas e exibições.

Explore o conteúdo do esquema para confirmar se o Matillion está conectado ao espaço de trabalho do Databricks.

Depois de verificar se você está conectado ao Azure Databricks, comece a criar pipelines no Matillion:

  • Crie seu primeiro Pipeline de Orquestração para transferir dados de fontes para o Azure Databricks.
  • Crie seu primeiro Pipeline de Transformação para formatar, limpar e preparar dados que já existem diretamente no Azure Databricks.
  • Use o Designer visual para criar fluxos de trabalho de dados usando uma interface de tela de arrastar e soltar.

Próximas etapas

Explore um ou mais dos seguintes recursos no site do Matillion: