Partilhar via


O que é data warehousing no Microsoft Fabric?

Aplica-se a:✅ ponto de extremidade de análise SQL e Armazém de Dados no Microsoft Fabric

O Fabric Data Warehouse é um armazém relacional em escala empresarial em uma base de data lake.

  • Os casos de uso ideais para o Fabric Data Warehouse são esquemas de estrela ou floco de neve, data marts corporativos com curadoria, modelos semânticos governados para business intelligence.
  • Os dados do Fabric Data Warehouse, como todos os dados do Fabric, são armazenados em tabelas Delta, que são arquivos de dados do Parquet com um log de transações baseado em arquivo. Construído no formato de dados abertos Fabric, um armazém permite o compartilhamento e a colaboração entre engenheiros de dados e usuários corporativos sem comprometer a segurança ou a governança.
  • O Fabric Data Warehouse é desenvolvido principalmente com T-SQL e compartilha uma grande área de superfície com base no Mecanismo de Banco de Dados SQL, com suporte total a transações ACID de várias tabelas, exibições materializadas, funções e procedimentos armazenados.
  • O carregamento em massa do Fabric Data Warehouse pode ser realizado por meio de conexões T-SQL e TDS, ou via Spark, com dados em massa gravados diretamente nas tabelas Delta.
  • A experiência SaaS fácil de usar também está totalmente integrada ao Power BI para facilitar a análise e a geração de relatórios.

Os clientes de armazém de dados beneficiam de:

  • As consultas entre bancos de dados podem usar várias fontes de dados para insights rápidos sem duplicação de dados.
  • Ingera, carregue e transforme facilmente dados em escala através de Pipelines, Dataflows, consulta cruzada de banco de dados ou o comando COPY INTO.
  • A gestão autónoma da carga de trabalho com o motor de processamento de consultas distribuído líder do setor significa que não há botões para ajustar para obter um desempenho de excelência.
  • Dimensione quase instantaneamente para atender às demandas de negócios. O armazenamento e a computação são separados.
  • Os dados são replicados automaticamente para os Arquivos OneLake para acesso externo.
  • Construído para qualquer nível de habilidade, desde o desenvolvedor cidadão até DBA ou engenheiro de dados.

Itens de armazenamento de dados

O Fabric Data Warehouse não é um armazém de dados corporativo tradicional, é um armazém em lago que suporta dois itens de armazenamento distintos: o item de armazém Fabric e o item de ponto de extremidade de análise SQL. Ambos são criados especificamente para atender às necessidades de negócios dos clientes, proporcionando o melhor desempenho da categoria, minimizando custos e reduzindo despesas gerais administrativas.

Armazém de dados de malha

Em um espaço de trabalho do Microsoft Fabric, um Fabric warehouse é rotulado como Depósito na coluna Tipo. Quando você precisa de todo o poder e recursos transacionais (suporte a consultas DDL e DML) de um data warehouse, esta é a solução rápida e simples para você.

Captura de tela mostrando o tipo de depósito no espaço de trabalho.

O armazém pode ser preenchido por qualquer um dos métodos de ingestão de dados suportados, como COPY INTO, Pipelines, Dataflows, ou opções de ingestão de banco de dados cruzado, como CREATE TABLE AS SELECT (CTAS), INSERT..SELECT, ou SELECT INTO.

Para começar a usar o Armazém, consulte:

Ponto de extremidade de análise SQL do Lakehouse

Em um Microsoft Fabric workspace, cada Lakehouse tem um "endpoint de análise SQL" gerado automaticamente que pode ser usado para fazer a transição da perspetiva "Lake" do Lakehouse (que suporta engenharia de dados e Apache Spark) para a perspetiva "SQL" do mesmo Lakehouse, permitindo criar vistas, funções, procedimentos armazenados e aplicar segurança SQL.

Captura de tela mostrando o tipo de ponto de extremidade da análise SQL no espaço de trabalho.

Usando tecnologia semelhante, um depósito, um banco de dados SQL e o Fabric OneLake provisionam automaticamente um ponto de extremidade de análise SQL quando criados.

Com o endpoint de análise SQL, os comandos T-SQL podem definir e consultar objetos de dados, mas não manipular ou modificar os dados. Você pode executar as seguintes ações no endereço de análise SQL:

  • Consulte as tabelas que fazem referência a dados em suas pastas Delta Lake no lago.
  • Crie vistas, TVFs em linha e procedimentos para encapsular a sua semântica e lógica empresarial em T-SQL.
  • Gerencie permissões nos objetos. Para obter mais informações sobre segurança no ponto de extremidade SQL analytics, consulte Segurança do OneLake para pontos de extremidade SQL analytics.

Para começar a usar o ponto final de análise do SQL, consulte:

Armazém ou casa do lago

Ao decidir entre usar um armazém ou um lakehouse, é importante considerar as necessidades específicas e o contexto de seus requisitos de gerenciamento e análise de dados.

  • Escolha um armazém de dados quando precisar de uma solução de escala empresarial com formato padrão aberto, sem desempenho de botões e configuração mínima.  Mais adequado para formatos de dados semiestruturados e estruturados, o data warehouse é adequado para profissionais de dados iniciantes e experientes, oferecendo experiências simples e intuitivas.

  • Escolha uma lakehouse quando precisar de um grande repositório de dados altamente não estruturados de fontes heterogêneas e quiser usar o Spark como sua principal ferramenta de desenvolvimento. Atuando como um armazém de dados "leve", você sempre tem a opção de usar o ponto de extremidade de análise SQL e as ferramentas T-SQL para fornecer cenários de relatórios e inteligência de dados em sua casa do lago.

Você sempre tem a oportunidade de adicionar um ou outro em um ponto posterior, caso suas necessidades de negócios mudem e, independentemente de onde você começar, tanto o armazém quanto o lakehouse usam o mesmo poderoso mecanismo SQL para todas as consultas T-SQL.

Para obter orientações de decisão mais detalhadas, consulte o guia de decisão do Microsoft Fabric: Escolha entre Warehouse e Lakehouse.

Migration

Use o Assistente de Migração de Malha para Data Warehouse para migrar do Azure Synapse Analytics, do SQL Server e de outras plataformas do Mecanismo de Banco de Dados SQL. Analise o planejamento de migração e os métodos de migração para pools SQL dedicados do Azure Synapse Analytics para o Fabric Data Warehouse.

Para obter orientações sobre migração no Microsoft Fabric, revise as ferramentas e os links na visão geral da migração do Microsoft Fabric.