Partilhar via


Espelhando o Snowflake no Microsoft Fabric

O espelhamento no Fabric oferece uma experiência fácil para evitar ETL (Extract Transform Load) complexo e integrar os dados existentes do armazém Snowflake com o restante dos dados no Microsoft Fabric. Você pode replicar continuamente seus dados existentes do Snowflake diretamente no OneLake da Fabric. Dentro do Fabric, você pode desbloquear cenários poderosos de business intelligence, inteligência artificial, engenharia de dados, ciência de dados e compartilhamento de dados.

Para obter um tutorial sobre como configurar seu banco de dados Snowflake para espelhamento na malha, consulte Tutorial: Configurar bancos de dados espelhados do Microsoft Fabric a partir do Snowflake.

Por que usar o espelhamento na malha?

Com o espelhamento na malha, você não precisa reunir serviços diferentes de vários fornecedores. Em vez disso, você pode desfrutar de um produto altamente integrado, de ponta a ponta e fácil de usar, projetado para simplificar suas necessidades de análise e criado para abertura e colaboração entre a Microsoft, a Snowflake e os 1000 anos de soluções de tecnologia que podem ler o formato de tabela Delta Lake de código aberto.

Que experiências analíticas são incorporadas?

Os bancos de dados espelhados são um item no Fabric Data Warehousing distinto do ponto de extremidade de análise Warehouse e SQL.

Diagrama de espelhamento de banco de dados Fabric para Snowflake.

O espelhamento cria estes itens no espaço de trabalho do Fabric:

  • O item de banco de dados espelhado. Isso permite cenários downstream, como engenharia de dados, ciência de dados e muito mais. Gestão de Espelhamento
    • A replicação dos metadados das tabelas Iceberg no OneLake é realizada através de atalhos para o armazenamento que contém as suas tabelas Iceberg. O OneLake converte automaticamente estas tabelas Iceberg para tabelas formatadas Delta Lake para utilização em cargas de trabalho Fabric.
    • A replicação de dados de tabelas de gestão para OneLake e a conversão para Parquet, num formato preparado para análises.
  • Um ponto de extremidade de análise SQL

Cada banco de dados espelhado tem um ponto de extremidade de análise SQL gerado automaticamente que fornece uma experiência analítica rica sobre as tabelas delta criadas pelo processo de espelhamento. Os usuários têm acesso a comandos T-SQL familiares que podem definir e consultar objetos de dados, mas não manipular os dados do ponto de extremidade de análise SQL, pois é uma cópia somente leitura. Você pode executar as seguintes ações no ponto de extremidade de análise SQL:

  • Explore as tabelas que fazem referência a dados em suas tabelas Delta Lake do Snowflake.
  • Não crie consultas e visualizações de código e explore dados visualmente sem escrever uma linha de código.
  • Desenvolva exibições SQL, TVFs embutidos (funções com valor de tabela) e procedimentos armazenados para encapsular sua semântica e lógica de negócios em T-SQL.
  • Gerencie permissões nos objetos.
  • Consulte dados em outros Armazéns e Lakehouses no mesmo espaço de trabalho.

Além do editor de consultas SQL, há um amplo ecossistema de ferramentas que podem consultar o ponto de extremidade de análise SQL, incluindo o SQL Server Management Studio (SSMS),a extensão mssql com o Visual Studio Code e até mesmo o GitHub Copilot.

Considerações de segurança

Para habilitar o espelhamento de malha, você precisará de permissões de usuário para seu banco de dados Snowflake que contém as seguintes permissões:

  • CREATE STREAM
  • SELECT table
  • SHOW tables
  • DESCRIBE tables

Para obter mais informações, consulte a documentação do Snowflake sobre privilégios de controle de acesso para tabelas de streaming e permissões necessárias para fluxos.

Importante

Qualquer segurança granular estabelecida no armazém Snowflake de origem deve ser reconfigurada no banco de dados espelhado no Microsoft Fabric. Para obter mais informações, consulte Permissões granulares do SQL no Microsoft Fabric.

Espelhando o Snowflake atrás do firewall

Verifique os requisitos de rede para acessar sua fonte de dados do Snowflake. Se sua fonte de dados do Snowflake não estiver acessível publicamente e estiver dentro de uma rede privada, crie um gateway de dados de rede virtual ou instale um gateway de dados local para espelhar os dados. A Rede Virtual do Azure ou a rede da máquina de gateway deve se conectar à instância do Snowflake por meio de um ponto de extremidade privado ou ser permitida pela regra de firewall. Para começar, consulte Tutorial: Configurar bancos de dados espelhados do Microsoft Fabric a partir do Snowflake.

Considerações sobre o custo do floco de neve espelhado

A computação de malha usada para replicar seus dados no Fabric OneLake é gratuita. O custo de armazenamento de espelhamento é gratuito até um limite com base na capacidade. Para obter mais informações, consulte Custo do espelhamento e Preços do Microsoft Fabric. A computação para consultar dados usando SQL, Power BI ou Spark é cobrada a taxas regulares.

O Fabric não cobra taxas de entrada de dados de rede no OneLake para espelhamento.

Há custos de computação e consulta em nuvem do Snowflake quando os dados estão sendo espelhados: computação de armazém virtual e computação de serviços em nuvem.

  • Encargos de computação do armazém virtual Snowflake:
    • As taxas de computação serão cobradas no lado do Snowflake se houver alterações de dados que estão sendo lidas no Snowflake e, por sua vez, estão sendo espelhadas no Fabric.
    • Quaisquer consultas de metadados executadas nos bastidores para verificar alterações de dados não são cobradas por qualquer computação do Snowflake; no entanto, consultas que produzam dados, como um SELECT * irá acordar o armazém Snowflake e computar será cobrado.
  • Os serviços Snowflake calculam as taxas:
    • Embora não haja cobranças de computação para tarefas de bastidores, como criação, consultas de metadados, controle de acesso, exibição de alterações de dados e até mesmo consultas DDL, há custos de nuvem associados a essas consultas.
    • Dependendo do tipo de edição Snowflake que você tem, você será cobrado pelos créditos correspondentes para quaisquer custos de serviços de nuvem.

Na captura de tela a seguir, você pode ver os custos de computação de armazém virtual e serviços de nuvem para o banco de dados Snowflake associado que está sendo espelhado no Fabric. Nesse cenário, a maioria dos custos de computação dos serviços de nuvem (em amarelo) vem de consultas de alteração de dados com base nos pontos mencionados anteriormente. As taxas de computação do armazém virtual (em azul) estão vindo estritamente das alterações de dados que estão sendo lidas do Snowflake e espelhadas no Fabric.

Screenshot do gráfico de custos de Flocos de Neve.

Para obter mais informações sobre os custos de consulta de nuvem específicos do Snowflake, consulte Documentos do Snowflake: Entendendo o custo geral.

Próximo passo