Partilhar via


O que é espelhamento em malha?

O espelhamento na malha é uma solução de baixo custo e baixa latência para reunir dados de vários sistemas em uma única plataforma de análise. Você pode replicar continuamente seu conjunto de dados existente diretamente no OneLake da Malha a partir de uma variedade de bancos de dados do Azure e fontes de dados externas.

Com os dados de data mais up-toem um formato consultável no OneLake, agora você pode usar todos os diferentes serviços no Fabric, como executar análises com o Spark, executar notebooks, engenharia de dados, visualizar por meio de Relatórios do Power BI e muito mais.

O espelhamento no Fabric permite que os usuários desfrutem de um produto altamente integrado, completo e fácil de usar, projetado para simplificar suas necessidades de análise. Criado para abertura e colaboração entre a Microsoft e soluções tecnológicas que podem ler o formato de tabela Delta Lake de código aberto, o Mirroring é uma solução turnkey de baixo custo e baixa latência que permite criar uma réplica de seus dados no OneLake que pode ser usada para todas as suas necessidades analíticas.

As tabelas Delta podem ser usadas em qualquer lugar do Fabric, permitindo que os usuários acelerem sua jornada no Fabric.

Por que usar o espelhamento na malha?

Hoje, muitas organizações têm dados operacionais ou analíticos de missão crítica em silos.

Acessar e trabalhar com esses dados hoje requer pipelines complexos de ETL (Extract Transform Load), processos de negócios e silos de decisão, criando:

  • Acesso restrito e limitado a dados importantes e em constante mudança
  • Atrito entre pessoas, processos e tecnologia
  • Longos tempos de espera para criar pipelines e processos para dados criticamente importantes
  • Não há liberdade para usar as ferramentas que você precisa para analisar e compartilhar insights confortavelmente
  • Falta de uma base adequada para as pessoas compartilharem e colaborarem em dados
  • Não há formatos de dados abertos comuns para todos os cenários analíticos - BI, IA, integração, engenharia e até mesmo aplicativos

O espelhamento no Fabric oferece uma experiência fácil para acelerar o tempo de implantação de insights e decisões e para quebrar silos de dados entre soluções de tecnologia:

  • Replicação quase em tempo real de dados e metadados em um data lake SaaS, com análise integrada para BI e IA

A plataforma Microsoft Fabric é construída sobre uma base de Software as a Service (SaaS), que leva a simplicidade e a integração a um nível totalmente novo. Para saber mais sobre o Microsoft Fabric, consulte O que é o Microsoft Fabric?

O espelhamento cria estes itens no espaço de trabalho do Fabric:

  • O espelhamento gerencia a replicação de dados e metadados no OneLake e a conversão para o Parquet, em um formato pronto para análise. Isso permite cenários downstream, como engenharia de dados, ciência de dados e muito mais.
  • Um ponto de extremidade de análise SQL

Além do editor de consultas SQL, há um amplo ecossistema de ferramentas, incluindo o SQL Server Management Studio (SSMS),a extensão mssql com o Visual Studio Code e até mesmo o GitHub Copilot.

O compartilhamento permite facilitar o controle e o gerenciamento de acesso, para garantir que você possa controlar o acesso a informações confidenciais. O compartilhamento também permite a tomada de decisões seguras e democratizadas em toda a sua organização.

Tipos de espelhamento

O Fabric oferece três abordagens diferentes para trazer dados para o OneLake por meio do espelhamento.

  • Espelhamento de banco de dados – O espelhamento de banco de dados no Microsoft Fabric permite a replicação de bancos de dados e tabelas inteiros, permitindo reunir dados de vários sistemas em uma única plataforma de análise.
  • Espelhamento de metadados – O espelhamento de metadados na malha sincroniza metadados (como nomes de catálogo, esquemas e tabelas) em vez de mover fisicamente os dados. Essa abordagem aproveita os atalhos, garantindo que os dados permaneçam em sua origem enquanto ainda são facilmente acessíveis no Fabric.
  • Espelhamento aberto – O espelhamento aberto na malha foi projetado para estender o espelhamento com base no formato de tabela Delta Lake aberta. Esse recurso permite que qualquer desenvolvedor escreva os dados de alteração de seu aplicativo diretamente em um item de banco de dados espelhado no Microsoft Fabric, com base na abordagem de espelhamento aberto e APIs públicas.

Atualmente, estão disponíveis as seguintes bases de dados externas:

Platform Replicação quase em tempo real Tipo de espelhamento Tutorial de ponta a ponta
Base de dados espelhadas do Microsoft Fabric do Azure Cosmos DB Yes Espelhamento de banco de dados Tutorial: Azure Cosmos DB
Bancos de dados espelhados do Microsoft Fabric do Azure Databricks Yes Espelhamento de metadados Tutorial: Azure Databricks
Bases de dados espelhadas do Microsoft Fabric a partir do Azure Database para servidor flexível PostgreSQL Yes Espelhamento de banco de dados Tutorial: Banco de Dados do Azure para servidor flexível PostgreSQL
Bancos de dados espelhados do Microsoft Fabric do Banco de Dados SQL do Azure Yes Espelhamento de banco de dados Tutorial: Banco de Dados SQL do Azure
Bancos de dados espelhados do Microsoft Fabric a partir da Instância Gerenciada do SQL do Azure Yes Espelhamento de banco de dados Tutorial: Instância Gerenciada SQL do Azure
Bases de dados espelhadas no Microsoft Fabric a partir do Google BigQuery (visualização) Yes Espelhamento de banco de dados Tutorial: Google BigQuery
Bancos de dados espelhados do Oracle no Microsoft Fabric (visualização) Yes Espelhamento de banco de dados Tutorial: Oracle
Bases de dados espelhadas do Microsoft Fabric no SAP (versão de teste) Yes Espelhamento de banco de dados Tutorial: SAP
Bancos de dados espelhados do Microsoft Fabric do Snowflake Yes Espelhamento de banco de dados Tutorial: Floco de neve
Bases de dados espelhadas do SQL Server no Microsoft Fabric Yes Espelhamento de banco de dados Tutorial: SQL Server
Abrir bancos de dados espelhados Yes Ativar espelhamento Tutorial: Abrir espelhamento
Bases de dados espelhadas no Microsoft Fabric a partir da base de dados SQL do Fabric Yes Espelhamento de banco de dados Configurado automaticamente

Como funciona a replicação quase em tempo real do espelhamento de banco de dados?

O espelhamento é habilitado criando uma conexão segura com sua fonte de dados operacionais. Você escolhe se deseja replicar um banco de dados inteiro ou tabelas individuais e o espelhamento manterá automaticamente seus dados sincronizados. Uma vez configurados, os dados serão replicados continuamente no OneLake para consumo de análise.

A seguir estão os princípios fundamentais do espelhamento:

  • Habilitar o espelhamento na malha é simples e intuitivo, sem a necessidade de criar pipelines de ETL complexos, alocar outros recursos de computação e gerenciar a movimentação de dados.

  • O espelhamento no Fabric é um serviço totalmente gerenciado, portanto, você não precisa se preocupar com hospedagem, manutenção ou gerenciamento da replicação da conexão espelhada.

Como funciona o espelhamento de metadados?

O espelhamento não só permite a replicação de dados, mas também pode ser alcançado por meio de atalhos ou espelhamento de metadados em vez da replicação completa de dados, permitindo que os dados estejam disponíveis sem movê-los fisicamente ou duplicá-los. O espelhamento, nesse contexto, refere-se à replicação apenas de metadados, como nomes de catálogo, esquemas e tabelas, em vez dos dados reais em si. Essa abordagem permite que o Fabric torne os dados de diferentes fontes acessíveis sem duplicá-los, simplificando o gerenciamento de dados e minimizando as necessidades de armazenamento.

Por exemplo, ao acessar dados registrados no Unity Catalog, o Fabric espelha apenas a estrutura do catálogo do Azure Databricks, permitindo que os dados subjacentes sejam acessados por meio de atalhos. Esse método garante que quaisquer alterações nos dados de origem sejam refletidas instantaneamente no Fabric sem exigir a movimentação de dados, mantendo a sincronização em tempo real e aumentando a eficiência no acesso às informações de data up-to.

Como funciona o espelhamento aberto?

Além de espelhar permitindo a replicação de dados criando uma conexão segura com sua fonte de dados, você também pode selecionar um provedor de dados existente ou gravar seu próprio aplicativo para colocar dados em banco de dados espelhado. Depois de criar um banco de dados espelhado aberto via API pública ou por meio do portal Fabric, você poderá obter uma URL de zona de aterrissagem no OneLake, onde poderá obter dados de alteração por especificação de espelhamento aberto.

Quando os dados estiverem na zona de aterrissagem com o formato adequado, a replicação começará a ser executada e gerenciará a complexidade de mesclar as alterações com atualizações, inserir e excluir para serem refletidas em tabelas delta. Esse método garante que todos os dados gravados na zona de pouso serão imediatamente e manterão os dados no Fabric up-to-date.

Partilha

O compartilhamento facilita o controle e o gerenciamento de acesso, enquanto os controles de segurança, como RLS (segurança em nível de linha) e OLS (segurança em nível de objeto), entre outros, garantem que você possa controlar o acesso a informações confidenciais. O compartilhamento também permite a tomada de decisões seguras e democratizadas em toda a sua organização.

Ao compartilhar, os usuários concedem a outros usuários ou a um grupo de usuários acesso a um banco de dados espelhado sem dar acesso ao espaço de trabalho e ao restante de seus itens. Quando alguém compartilha um banco de dados espelhado, também concede acesso ao ponto de extremidade de análise SQL.

Para obter mais informações, consulte Compartilhar seu banco de dados espelhado e gerenciar permissões.

Consultas entre bancos de dados

Com os dados do seu banco de dados espelhado armazenados no OneLake, você pode escrever consultas entre bancos de dados, unindo dados de bancos de dados espelhados, armazéns e pontos de extremidade de análise SQL do Lakehouses em uma única consulta T-SQL. Para obter mais informações, consulte Escrever uma consulta entre bancos de dados.

Por exemplo, você pode fazer referência à tabela a partir de bancos de dados espelhados e armazéns usando nomenclatura de três partes. No exemplo a seguir, use o nome de três partes para ContosoSalesTable se referir no depósito ContosoWarehouse. De outros bancos de dados ou depósitos, a primeira parte da convenção de nomenclatura SQL padrão de três partes é o nome do banco de dados espelhado.

SELECT * 
FROM ContosoWarehouse.dbo.ContosoSalesTable AS Contoso
INNER JOIN Affiliation
ON Affiliation.AffiliationId = Contoso.RecordTypeID;

Custo do espelhamento

Para espelhamento de banco de dados e espelhamento aberto, a computação de malha e o armazenamento OneLake são liberados até um limite baseado em capacidade.

  • O armazenamento para réplicas é liberado até um limite com base no tamanho da capacidade. O espelhamento oferece um terabyte gratuito de armazenamento de espelhamento para cada unidade de capacidade () adquirida. Por exemplo, se você comprar uma capacidade F64, obterá 64 terabytes gratuitos de armazenamento, usados exclusivamente para espelhamento. O armazenamento do OneLake é cobrado se o limite de armazenamento de espelhamento gratuito for excedido ou quando a capacidade for pausada. Para obter mais informações, consulte Preços do Microsoft Fabric.
  • A computação de malha em segundo plano usada para replicar seus dados no Fabric OneLake é gratuita e não consome capacidade. Solicitações diretamente ao OneLake para dados espelhados consomem capacidade como consumo de computação normal do OneLake. A computação para consultar dados usando SQL, Power BI ou Spark é cobrada a taxas regulares.
  • Uma capacidade de malha em execução é necessária apenas para a configuração inicial do espelhamento.

Engenharia de dados com seus dados de banco de dados espelhados

O Microsoft Fabric fornece vários recursos de engenharia de dados para garantir que seus dados sejam facilmente acessíveis, bem organizados e de alta qualidade. No Fabric Data Engineering, você pode:

  • Crie e gerencie seus dados como Spark usando uma lakehouse
  • Projete pipelines para copiar dados para sua casa no lago
  • Usar definições de trabalho do Spark para enviar trabalho em lote/streaming para o cluster do Spark
  • Usar blocos de anotações para escrever código para ingestão, preparação e transformação de dados

Ciência de dados com seus dados de banco de dados espelhados

O Microsoft Fabric oferece o Fabric Data Science para capacitar os usuários a concluir fluxos de trabalho completos de ciência de dados com a finalidade de enriquecimento de dados e insights de negócios. Você pode concluir uma ampla gama de atividades em todo o processo de ciência de dados, desde a exploração, preparação e limpeza de dados até a experimentação, modelagem, pontuação de modelos e fornecimento de insights preditivos para relatórios de BI.

Os usuários do Microsoft Fabric podem acessar cargas de trabalho de Ciência de Dados. A partir daí, eles podem descobrir e acessar vários recursos relevantes. Por exemplo, eles podem criar experimentos, modelos e notebooks de aprendizado de máquina. Eles também podem importar Blocos de Anotações existentes na página inicial de Ciência de Dados.

Direct Lake com seus dados de banco de dados espelhados

O modo Direct Lake pode ser usado com bancos de dados espelhados no Microsoft Fabric para permitir consultas de alto desempenho sobre dados espelhados sem a necessidade de movimentação ou duplicação de dados. Quando um banco de dados espelhado é criado, seus dados são armazenados no formato Delta Lake no OneLake. Esse formato nativo permite que o Power BI e outras ferramentas de análise se conectem por meio do modo Direct Lake, oferecendo insights quase em tempo real acessando diretamente os arquivos subjacentes. Essa integração combina a simplicidade do espelhamento com a velocidade e a escalabilidade do Direct Lake, permitindo relatórios rápidos e up-toatualizados sobre dados operacionais.

Retenção para dados espelhados

O espelhamento no Fabric replica continuamente sua propriedade de dados existente no OneLake no formato de tabela Delta Lake. Para manter os dados espelhados armazenados de forma eficiente e sempre prontos para análise, o espelhamento executa automaticamente o vácuo para remover arquivos antigos que não são mais referenciados por um log Delta.

Você pode personalizar a configuração de retenção de acordo com suas necessidades. Por exemplo, você pode escolher um período de retenção mais curto para reduzir o consumo de armazenamento de espelhamento ou estender o período de retenção para utilizar os recursos de viagem no tempo da Delta para análise.

Para bancos de dados espelhados criados a partir do portal Fabric após meados de junho de 2025, a retenção padrão é de um dia. Para bancos de dados espelhados antigos, o padrão é sete dias. Para verificar ou atualizar a configuração de retenção, no portal Malha, navegue até a guia Banco de dados espelhado ->Configurações ->Manutenção e especifique o limite de retenção. Você também pode configurá-lo via API pública especificando a retentionInDays propriedade.

Banco de dados SQL no Fabric

Também pode criar e gerir diretamente uma base de dados SQL no Microsoft Fabric dentro do portal Fabric. Com base no Banco de Dados SQL do Azure, o banco de dados SQL no Fabric é espelhado automaticamente para fins de análise e permite que você crie facilmente seu banco de dados operacional no Fabric. O banco de dados SQL é a página inicial do Fabric para cargas de trabalho OLTP e pode se integrar à integração de controle de origem do Fabric.