Partilhar via


Tutorial: Configurar o espelhamento para o Google BigQuery (Pré-visualização)

Neste tutorial, você configurará um banco de dados espelhado do Fabric a partir do Google BigQuery.

Observação

Embora este exemplo seja específico do BigQuery, você pode encontrar etapas detalhadas para configurar o Espelhamento para outras fontes de dados, como o Banco de Dados SQL do Azure ou o Azure Cosmos DB. Para obter mais informações, consulte O que é espelhamento na malha?

Pré-requisitos

  • Crie ou use um depósito existente do BigQuery. Você pode se conectar a qualquer versão da instância do BigQuery em qualquer nuvem, incluindo o Microsoft Azure.
  • Você precisa de uma capacidade existente do Fabric. Caso não o faça, inicie uma avaliação dos serviços do Fabric.

Requisitos de permissão

Você precisa de permissões de usuário para seu banco de dados do BigQuery que contém as seguintes permissões:

  • bigquery.datasets.create
  • bigquery.tables.list
  • bigquery.tables.create
  • bigquery.tables.export
  • bigquery.tables.get
  • bigquery.tables.getData
  • bigquery.tables.updateData
  • bigquery.routines.get
  • bigquery.routines.list
  • bigquery.jobs.create
  • storage.buckets.create
  • storage.buckets.list
  • storage.objects.create
  • storage.objects.delete
  • storage.objects.list
  • iam.serviceAccounts.signBlob

As funções BigQueryAdmin e StorageAdmin devem incluir essas permissões.

Mais permissões podem ser necessárias, dependendo do seu caso de uso. As permissões mínimas necessárias são necessárias para trabalhar com o histórico de alterações e lidar com tabelas de vários tamanhos (tabelas maiores que 10GB). Mesmo que você não esteja trabalhando com tabelas maiores que 10 GB, habilite todas essas permissões mínimas para habilitar o sucesso do uso do Espelhamento.

Para obter mais informações sobre permissões, consulte a documentação do Google BigQuery sobre Privilégios necessários para streaming de dados, Permissões necessárias para acesso ao histórico de alterações e Permissões necessárias para escrever resultados de consulta

O usuário precisa ter pelo menos uma função atribuída que permita acesso à instância do BigQuery. Verifique os requisitos de rede para acessar sua fonte de dados do BigQuery. Se estiver a usar o Espelhamento no Google BigQuery no On-Premises Data Gateway (OPDG), deverá ter a versão 3000.286.6 ou superior do OPDG para ativar o Espelhamento com sucesso.

Para obter informações sobre por que essas permissões são necessárias, consulte a documentação de limitações de permissões.

Importante

Qualquer segurança granular estabelecida no armazém do BigQuery de origem deve ser reconfigurada no banco de dados espelhado no Microsoft Fabric. Para obter mais informações, consulte Permissões granulares do SQL no Microsoft Fabric.

Criar um banco de dados espelhado

Nesta seção, você cria um novo banco de dados espelhado a partir da fonte de dados espelhada do BigQuery.

Você pode usar um espaço de trabalho existente (não Meu Espaço de Trabalho) ou criar um novo espaço de trabalho.

  1. No seu espaço de trabalho, navegue até ao hub Criar.
  2. Depois de selecionar o espaço de trabalho que deseja usar, selecione Criar.
  3. Selecione o Cartão Espelhado do Google BigQuery.
  4. Insira o nome do novo banco de dados.
  5. Selecione Criar.

Conecte-se à sua instância do BigQuery em qualquer nuvem

Observação

Talvez seja necessário alterar o firewall da nuvem para permitir que o Mirroring se conecte à instância do BigQuery. Suportamos o Mirroring para Google BigQuery para OPDG versão 3000.286.6 ou superior.

  1. Selecione BigQuery em Nova conexão ou selecione uma conexão existente.

  2. Se você selecionou Nova conexão, insira os detalhes da conexão com o banco de dados do BigQuery.

    Configuração de conexão Description
    E-mail da conta de serviço Se tiver uma conta de serviço preexistente: pode encontrar o e-mail da sua Conta de serviço e a sua chave existente acedendo a Contas de serviço na consola do Google BigQuery. Se você não tiver uma conta de serviço preexistente: vá para "Contas de serviço" no console do Google BigQuery e selecione Criar conta de serviço. Insira um nome de conta de serviço (um ID de conta de serviço é gerado automaticamente com base no nome da conta de serviço inserida) e uma descrição da conta de serviço. Selecione Concluído. Copie e cole o e-mail da conta de serviço na seção de credenciais de conexões designadas no Fabric.
    Conteúdo do arquivo de chave JSON da Conta de Serviço No painel Contas de serviço, selecione Ações para sua conta de serviço recém-criada. Selecione Gerenciar chaves. Se você já tiver uma chave por sua conta de serviço, baixe o conteúdo do arquivo de chave JSON.

    Se ainda não tiver uma chave por sua conta de serviço, selecione Adicionar chave e Criar nova chave. Em seguida, selecione JSON. O arquivo de chave JSON deve ser baixado automaticamente. Copie e cole a chave JSON na seção de credenciais de conexões designadas no portal da malha.
    Conexão Crie uma nova conexão.
    Nome da conexão Deve ser preenchido automaticamente. Altere-o para um nome que você gostaria de usar.
  3. Selecione o banco de dados na lista suspensa.

Iniciar o processo de espelhamento

  1. A tela Configurar espelhamento permite espelhar todos os dados no banco de dados, por padrão.

    • Espelhar todos os dados significa que todas as novas tabelas criadas após o início do espelhamento serão espelhadas.

    • Opcionalmente, escolha apenas determinados objetos para espelhar. Desative a opção Espelhar todos os dados e selecione tabelas individuais do banco de dados.

    Para este exemplo, usamos a opção Espelhar todos os dados .

  2. Selecione Base de dados de espelho. Começa o espelhamento.

  3. Aguarde 2-5 minutos. Em seguida, selecione Monitorar replicação para ver o status.

  4. Após alguns minutos, o status deve mudar para Executando, o que significa que as tabelas estão sendo sincronizadas.

    Se você não vir as tabelas e o status de replicação correspondente, aguarde alguns segundos e atualize o painel.

  5. Quando eles terminarem a cópia inicial das tabelas, uma data aparecerá na coluna Última atualização .

  6. Agora que os seus dados estão em funcionamento, há vários cenários de análise disponíveis em todo o Fabric.

Importante

  • O espelhamento para o Google BigQuery tem um atraso de ~15 minutos na propagação das alterações. Esta é uma limitação da tecnologia Change Data Capture (CDC) do Google BigQuery.
  • Qualquer segurança granular estabelecida no banco de dados de origem deve ser reconfigurada no banco de dados espelhado no Microsoft Fabric.

Espelhamento de malha do monitor

Assim que o espelhamento estiver configurado, você será direcionado para a página de Status de Espelhamento. Aqui, você pode monitorar o estado atual da replicação.

Para obter mais informações e detalhes sobre os estados de replicação, consulte Replicação de banco de dados espelhado do Monitor Fabric.

Importante

Se não houver atualizações nas tabelas de origem no banco de dados do BigQuery, o mecanismo replicador (o mecanismo que alimenta os dados de alteração para o BigQuery Mirroring) ficará mais lento e replicará apenas tabelas a cada hora. Não se surpreenda se os dados após o carregamento inicial estiverem demorando mais do que o esperado, especialmente se você não tiver novas atualizações em suas tabelas de origem. Após o snapshot, o Mirror Engine aguardará ~15 minutos antes de buscar alterações; isso se deve a uma limitação do Google BigQuery, na qual ele decreta um atraso de 10 minutos para refletir quaisquer novas alterações. Saiba mais sobre o atraso de reflexão de alterações do BigQuery