Partilhar via


Introdução ao Azure Synapse Link para o SQL Server 2022

Este artigo é um guia passo a passo para começar a usar o Azure Synapse Link para SQL Server 2022. Para obter uma visão geral, consulte Azure Synapse Link for SQL Server 2022.

Importante

A integração com o Microsoft Fabric já está disponível. O Mirroring to Fabric fornece todas as capacidades do Azure Synapse Link com melhor desempenho analítico, a capacidade de unificar o seu património de dados com o OneLake no Fabric e acesso aberto aos seus dados no formato Delta Parquet. Em vez do Azure Synapse Link, use o Espelhamento de Malha.

Com o Mirroring to Microsoft Fabric, você pode replicar continuamente seu conjunto de dados existente diretamente no OneLake in Fabric, incluindo dados do SQL Server 2016+, Banco de Dados SQL do Azure, Instância Gerenciada SQL do Azure, Oracle, Snowflake, Cosmos DB e muito mais.

Para obter mais informações, consulte Bancos de dados espelhados do Microsoft Fabric.

Pré-requisitos

  • Antes de começar, consulte Criar um novo espaço de trabalho do Azure Synapse para obter o Azure Synapse Link for SQL. O tutorial atual é criar o Azure Synapse Link for SQL em uma rede pública. Este artigo pressupõe que você selecionou Desabilitar rede virtual gerenciada e Permitir conexões de todos os endereços IP ao criar um espaço de trabalho do Azure Synapse. Se você quiser configurar o Azure Synapse Link para SQL Server 2022 com segurança de rede, consulte também Configurar o Azure Synapse Link para SQL Server 2022 com segurança de rede.

  • Crie uma conta do Azure Data Lake Storage Gen2, que é diferente da conta criada com o espaço de trabalho do Azure Synapse Analytics. Você usará essa conta como a zona de aterrissagem para preparar os dados enviados pelo SQL Server 2022. Para obter mais informações, consulte Criar uma conta do Azure Data Lake Storage Gen2.

  • Verifique se o banco de dados do SQL Server 2022 tem uma chave mestra criada.

    CREATE MASTER KEY ENCRYPTION BY PASSWORD = '<a new password>'
    

Crie seu pool dedicado SQL do Azure Synapse de destino

  1. Abra o Synapse Studio.

  2. Abra o hub de Gestão, vá para pools de SQL, e selecione Novo.

    Captura de tela que mostra como criar um novo pool dedicado SQL do Azure Synapse a partir do Synapse Studio.

  3. Insira um nome de pool exclusivo, use as configurações padrão e crie o pool dedicado.

  4. No hub de dados, em Espaço de trabalho, seu novo banco de dados SQL do Azure Synapse deve ser listado em Bancos de dados. No seu novo banco de dados SQL do Azure Synapse, selecione Novo script SQL e, em seguida, selecione Script vazio.

    Captura de tela que mostra como criar um novo script SQL vazio do Synapse Studio.

  5. Para criar a chave mestra para o banco de dados SQL do Azure Synapse de destino, cole o script a seguir e selecione Executar.

    CREATE MASTER KEY
    

Criar um serviço vinculado para seu banco de dados SQL Server 2022 de origem

  1. Selecione o botão Gerenciar hub e, em seguida, selecione Serviços vinculados.

    Vá para serviços vinculados do Synapse Studio.

  2. Pressione Novo, selecione SQL Server e selecione Continuar.

    Captura de tela que mostra como criar um serviço vinculado do SQL Server.

  3. Na caixa Nome, digite o nome do serviço vinculado do SQL Server 2022.

    Captura de tela que mostra onde inserir os nomes do servidor e do banco de dados para se conectar.

    Nota

    Somente o Serviço Vinculado na versão herdada é suportado.

  4. Ao escolher o tempo de execução de integração, selecione seu tempo de execução de integração auto-hospedado. Se o seu espaço de trabalho do Azure Synapse não tiver um tempo de execução de integração auto-hospedado disponível, crie um.

  5. (Opcional) Para criar um tempo de execução de integração auto-hospedado para se conectar ao SQL Server 2022 de origem, faça o seguinte:

    a. Selecione Novo.

    Captura de ecrã que mostra como criar uma nova runtime de integração autogerida.

    b. Selecione Auto-hospedado e, em seguida, selecione Continuar.

    c. Na caixa Nome, digite o nome do tempo de execução de integração auto-hospedado e selecione Criar.

    Captura de ecrã que mostra onde introduzir um nome para o runtime de integração auto-hospedado.

    Um runtime de integração autoalojado está agora disponível no seu espaço de trabalho do Azure Synapse.

    d. Siga as instruções para baixar, instalar e usar a chave para registrar seu agente de tempo de execução de integração em sua máquina Windows, que tem acesso direto à sua instância do SQL Server 2022. Para obter mais informações, consulte Criar um tempo de execução de integração auto-hospedado - Azure Data Factory e Azure Synapse.

    Captura de tela que mostra onde baixar, instalar e registrar o tempo de execução da integração.

    e. Selecione Fechar.

    Obtenha o status do tempo de execução da integração.

    f. Vá para a página de monitoramento e verifique se o tempo de execução da integração auto-hospedada está em execução selecionando Atualizar para obter o status mais recente do tempo de execução da integração.

  6. Continue a inserir as informações restantes para seu serviço vinculado, incluindo nome do SQL Server, Nome do banco de dados, Tipo de autenticação, Nome de usuário e Senha para se conectar à sua instância do SQL Server 2022.

    Nota

    Recomendamos que você habilite a criptografia nessa conexão. Para fazer isso, adicione a propriedade Encrypt com um valor de true como uma propriedade adicional de conexão. Também defina a propriedade Trust Server Certificate para true ou false, dependendo da configuração do seu servidor. Para obter mais informações, consulte Habilitar conexões criptografadas com o mecanismo de banco de dados.

  7. Selecione Testar ligação para garantir que o seu runtime de integração autoalojado possa aceder à sua instância do SQL Server.

  8. Selecione Criar.

    Seu novo serviço vinculado será conectado à instância do SQL Server 2022 disponível em seu espaço de trabalho.

    Captura de tela que mostra onde exibir a conexão de serviço vinculado.

    Nota

    O serviço vinculado que você cria aqui não é dedicado ao Azure Synapse Link for SQL. Ele pode ser usado por qualquer usuário do espaço de trabalho que tenha as permissões apropriadas. Reserve um tempo para entender o escopo dos usuários que podem ter acesso a esse serviço vinculado e suas credenciais. Para obter mais informações sobre permissões nos espaços de trabalho do Azure Synapse, consulte Visão geral do controle de acesso do espaço de trabalho do Azure Synapse - Azure Synapse Analytics.

Criar um serviço vinculado para se conectar à sua zona de aterrissagem no Azure Data Lake Storage Gen2

  1. Vá para sua conta recém-criada do Azure Data Lake Storage Gen2, selecione Controle de Acesso (IAM), selecione Adicionar e selecione Adicionar atribuição de função.

    Captura de tela do painel 'Controle de acesso (IAM)' da conta do Data Lake Storage Gen2.

  2. Selecione Colaborador de Dados de Blob de Armazenamento para a função escolhida, selecione Identidade Gerida e, em Membros, selecione o seu Espaço de Trabalho Synapse do Azure. Adicionar essa atribuição de função pode levar alguns minutos.

    Captura de tela que mostra como adicionar uma atribuição de função.

    Nota

    Certifique-se de que concedeu permissões de identidade gerida ao espaço de trabalho do Azure Synapse para a conta de armazenamento do Azure Data Lake Storage Gen2 que é utilizada como zona de aterragem. Para obter mais informações, consulte Conceder permissões a uma identidade gerenciada em um espaço de trabalho do Azure Synapse - Azure Synapse Analytics.

  3. Abra o hub Gerenciar em seu espaço de trabalho do Azure Synapse e vá para Serviços vinculados.

    Captura de tela que mostra como ir para o serviço vinculado.

  4. Selecione Novo e, em seguida, selecione Azure Data Lake Storage Gen2.

  5. Efetue o seguinte procedimento:

    a. Na caixa Nome, digite o nome do serviço vinculado para sua zona de destino.

    b. Em Método de autenticação, insira Identidade gerenciada.

    c. Selecione o nome da conta de armazenamento, que já foi criada.

  6. Selecione Testar Conexão para garantir que você possa acessar sua conta do Azure Data Lake Storage Gen2.

  7. Selecione Criar.

    Seu novo serviço vinculado será conectado à conta do Azure Data Lake Storage Gen2.

    Captura de tela que mostra o novo serviço vinculado ao Azure Data Lake Storage Gen2.

    Nota

    O serviço vinculado que você cria aqui não é dedicado ao Azure Synapse Link for SQL. Ele pode ser usado por qualquer usuário do espaço de trabalho que tenha as permissões apropriadas. Reserve um tempo para entender o escopo dos usuários que podem ter acesso a esse serviço vinculado e suas credenciais. Para obter mais informações sobre permissões nos espaços de trabalho do Azure Synapse, consulte Visão geral do controle de acesso do espaço de trabalho do Azure Synapse - Azure Synapse Analytics.

  1. No Synapse Studio, abra o hub Integrate.

  2. No painel Integrar, selecione o sinal de adição (+) e, em seguida, selecione Ligação de ligação.

    Captura de ecrã que mostra o botão 'Ligação'.

  3. Insira seu banco de dados de origem:

    a. Para Tipo de origem, selecione SQL Server.

    b, Para seu serviço vinculado de origem, selecione o serviço que se conecta à sua instância do SQL Server 2022.

    c. Para Nomes de tabela, selecione nomes de sua instância do SQL Server a serem replicados para seu pool SQL do Azure Synapse.

    d. Selecione Continuar.

    Captura de tela que mostra onde inserir os detalhes do banco de dados de origem.

  4. Em Synapse SQL Dedicated Pools, selecione um nome de banco de dados de destino.

  5. Selecione Continuar.

  6. Insira as suas definições de conexão.

    a. Em Nome da ligação, introduza o nome.

    b. Para a Contagem de núcleos na computação da conexão de link, insira o número de núcleos. Esses núcleos serão usados para a movimentação de dados da origem para o destino. Recomendamos que você comece com um pequeno número e aumente a contagem conforme necessário.

    c. Em Serviço vinculado, selecione o serviço que se conectará à sua zona de destino.

    d. Insira o nome do contêiner do Azure Data Lake Storage Gen2 ou o nome do contêiner/pasta como caminho de pasta da zona de chegada para estagiar os dados. O contêiner deve ser criado primeiro.

    e. Insira seu token de assinatura de acesso compartilhado do Azure Data Lake Storage Gen2. O token é necessário para que o feed de alterações SQL acesse a zona de aterrissagem. Se sua conta do Azure Data Lake Storage Gen2 não tiver um token de assinatura de acesso compartilhado, você poderá criar um selecionando Gerar token.

    f. Selecione OK.

    Captura de tela que mostra onde inserir as configurações de conexão do link.

    Nota

    O número de núcleos selecionados aqui é alocado ao serviço de ingestão para processar o carregamento e as alterações de dados. Eles não afetam a configuração do pool SQL dedicado de destino. Se não for possível conectar-se à zona de aterrissagem usando o token SAS gerado devido à limitação do seu armazenamento, você pode tentar usar o token SAS de delegação para se conectar à zona de aterrissagem também.

  7. Com a nova conexão do Azure Synapse Link aberta, agora você pode atualizar o nome da tabela de destino, o tipo de distribuição e o tipo de estrutura.

    Nota

    • Considere o uso da tabela heap para o tipo de estrutura quando os seus dados contiverem varchar(max), nvarchar(max) e varbinary(max).
    • Assegure-se de que o esquema no seu pool dedicado do Azure Synapse SQL já foi criado antes de iniciar a ligação. O Azure Synapse Link for SQL criará tabelas automaticamente sob seu esquema no pool SQL do Azure Synapse.
  8. Na lista suspensa Ação na tabela de destino existente, escolha a opção mais apropriada para o seu cenário caso a tabela já exista no destino.

    • Eliminar e recriar tabela: A tabela de destino existente será descartada e recriada.
    • Falha em tabela não vazia: Caso a tabela de destino contenha dados, a ligação correspondente para a tabela em questão falhará.
    • Mesclar com os dados existentes: Os dados serão mesclados na tabela existente.

    Nota

    Se você quiser mesclar várias fontes no mesmo destino escolhendo "Mesclar com dados existentes", verifique se as fontes contêm dados diferentes para evitar conflitos e resultados inesperados.

  9. Especifique se deseja habilitar a consistência da transação entre tabelas.

    • Quando essa opção está habilitada, uma transação que abrange várias tabelas no banco de dados de origem é sempre replicada para o banco de dados de destino em uma única transação. Isso, no entanto, criará sobrecarga na taxa de transferência geral da replicação.
    • Quando a opção estiver desabilitada, cada tabela replicará as alterações em seu próprio limite de transação para o destino em conexões paralelas, melhorando assim a taxa de transferência geral da replicação.

    Nota

    Quando se quiser habilitar a consistência da transação entre tabelas, verifique também se os níveis de isolamento de transação no pool SQL dedicado do Synapse estão em *READ COMMITTED SNAPSHOT ISOLATION*.

  10. Selecione Publicar tudo para salvar a nova conexão de link com o serviço.

Selecione Iniciar e aguarde alguns minutos para que os dados sejam replicados.

Nota

Uma ligação começará com uma carga inicial completa do banco de dados de origem, seguida por atualizações incrementais através do recurso de feed de alterações no SQL Server 2022. Para obter mais informações, consulte Azure Synapse Link for SQL change feed.

Você pode monitorizar o status da sua conexão do Azure Synapse Link, ver quais tabelas estão a ser copiadas inicialmente (captura instantânea) e ver quais tabelas estão no modo de replicação contínua (replicando continuamente).

  1. Vá para o hub de Monitorização do seu espaço de trabalho do Azure Synapse e, em seguida, selecione Ligações de vínculo.

  2. Abra a conexão de link iniciada e visualize o status de cada tabela.

  3. Selecione Atualizar na vista de monitorização da sua ligação para observar quaisquer atualizações ao estado.

    Monitore a conexão vinculada.

Consultar os dados replicados

Aguarde alguns minutos e, em seguida, verifique se o banco de dados de destino tem a tabela e os dados esperados. Consulte os dados disponíveis em seu repositório de destino do pool dedicado SQL do Azure Synapse. Agora você também pode explorar as tabelas replicadas em seu pool dedicado SQL do Azure Synapse de destino.

  1. No hub de Data, em Workspace, abra a base de dados de destino.

  2. Em Tabelas, clique com o botão direito do rato numa das tabelas de destino.

  3. Selecione Novo script SQL e, em seguida, selecione As 100 principais linhas.

  4. Execute esta consulta para exibir os dados replicados em seu pool dedicado SQL do Azure Synapse de destino.

  5. Você também pode consultar o banco de dados de destino usando o Microsoft SQL Server Management Studio (SSMS) ou outras ferramentas. Utilize o endpoint dedicado SQL para o seu espaço de trabalho como o nome do servidor. Este nome é geralmente <workspacename>.sql.azuresynapse.net. Adicione Database=databasename@poolname como um parâmetro de cadeia de conexão extra ao se conectar via SSMS ou outras ferramentas.

Para adicionar ou remover tabelas no Synapse Studio, faça o seguinte:

  1. No espaço de trabalho do Azure Synapse, abra o hub Integrar .

  2. Selecione a ligação que pretende editar e, em seguida, abra-a.

  3. Efetue um dos seguintes procedimentos:

    • Para adicionar uma tabela, selecione Nova tabela.
    • Para remover uma tabela, selecione o ícone da lixeira ao lado dela.

    Captura de ecrã do painel de conexão de link para adicionar ou remover tabelas.

    Nota

    Você pode adicionar ou remover tabelas diretamente quando uma conexão de link estiver em execução.

Para interromper a conexão do Azure Synapse Link no Synapse Studio, faça o seguinte:

  1. No espaço de trabalho do Azure Synapse, abra o hub Integrar .

  2. Selecione a ligação que pretende editar e, em seguida, abra-a.

  3. Selecione Parar para interromper a conexão do link e isso irá parar a replicação dos seus dados.

    Captura de ecrã do painel para interromper uma ligação.

    Nota

    • Se uma ligação for reiniciada após ser interrompida, começará com uma carga inicial completa do banco de dados de origem, seguida pelos fluxos de alterações incrementais.
    • Se escolher "Fundir com dados existentes" como a ação na tabela de destino existente, quando parar a ligação e a reiniciar, os registos eliminados na origem durante esse tempo não serão eliminados no destino. Nesse caso, para garantir a consistência dos dados, considere usar pausa/retomada em vez de parar/iniciar ou limpar as tabelas de destino antes de reiniciar a conexão de link.

Girar o token de assinatura de acesso compartilhado para a zona de aterrissagem

Um token de assinatura de acesso compartilhado é necessário para que o feed de alterações SQL aceda à área de destino e lá transfira os dados. Ele tem uma data de validade, então você precisa girar o token antes dessa data. Caso contrário, o Azure Synapse Link não conseguirá replicar os dados da instância do SQL Server para o pool dedicado SQL do Azure Synapse.

  1. No espaço de trabalho do Azure Synapse, abra o hub Integrar .

  2. Selecione a ligação que pretende editar e, em seguida, abra-a.

  3. Selecione Girar símbolo.

    Captura de tela que mostra onde girar um token de assinatura de acesso compartilhado.

  4. Para obter o novo token de assinatura de acesso compartilhado, selecione Gerar automaticamente ou Inserir manualmente e, em seguida, selecione OK.

    Captura de tela que mostra como obter um novo token de assinatura de acesso compartilhado.

    Nota

    Se não for possível conectar-se à zona de aterrissagem usando o token SAS gerado devido à limitação do seu armazenamento, você pode tentar usar o token SAS de delegação para se conectar à zona de aterrissagem também.

Próximos passos

Se você estiver usando um banco de dados diferente do SQL Server 2022, consulte: