O que é um banco de dados de grafo?

Observação

Esse recurso está atualmente em versão prévia pública. Essa versão prévia é oferecida sem um SLA e não é recomendada para cargas de trabalho de produção. Alguns recursos podem não ter suporte ou podem ter restrição de recursos. Para obter mais informações, consulte Termos de Uso Complementares para Versões Prévias do Microsoft Azure.

Um banco de dados de grafo modela dados como uma rede de entidades e relações conectadas. O tipo mais usado de banco de dados de grafo implementa o modelo de grafo de propriedade rotulado, em que entidades (nós) e relações (arestas) podem ter rótulos e propriedades (pares chave-valor). Esse modelo flexível permite designs com esquema opcional e orientados por esquema e permite que você expresse semântica rica. Como as conexões são armazenadas explicitamente como bordas, as consultas atravessam relações seguindo bordas em vez de computar junções caras em tempo de consulta.

Importante

Este artigo utiliza exclusivamente o conjunto de dados de exemplos de grafos de redes sociais.

Conceitos principais do banco de dados do Graph

Os nós representam coisas como pessoas, produtos ou lugares. Os nós podem ter rótulos e propriedades que descrevem seus atributos.
As bordas representam como essas coisas estão conectadas, por exemplo, FRIENDS_WITH, PURCHASED ou LOCATED_IN. As bordas também podem carregar propriedades e rótulos para codificar metadados de relacionamento.
As propriedades anexam detalhes a nós e arestas (por exemplo, o nome de uma pessoa ou a data de início de uma aresta). Como as relações são armazenadas explicitamente como bordas, as consultas navegam no grafo seguindo conexões em vez de computá-las no momento da consulta.

Como funciona a consulta de relacionamentos

As consultas de grafo recuperam informações conectadas percorrendo a partir de um nó inicial até seus vizinhos e, em seguida, até os vizinhos deles, e assim por diante. O esforço realizado por uma passagem está vinculado ao número de bordas que ele toca (o bairro local), não ao tamanho total do conjunto de dados. Isso torna perguntas sobre caminhos, conexões e padrões, como amigos de amigos, caminhos mais curtos ou dependências de vários saltos, naturais e eficientes a expressar.

Os bancos de dados do Graph usam linguagens de consulta baseadas em padrões, como a GQL (Linguagem de Consulta graph) cada vez mais adotada, para descrever essas travessias de forma concisa. A GQL está sendo padronizada pelo mesmo grupo de trabalho internacional que supervisiona o SQL (ISO/IEC 39075), alinhando a consulta de grafo com os padrões de banco de dados estabelecidos.

Exemplo (correspondência de padrões com GQL):

MATCH (p:Person {firstName: "Annemarie"})-[:knows]->(friend)-[:likes]->(c:Comment)
RETURN c
ORDER BY c.creationDate
LIMIT 100

Este padrão é lido como: começando no nó Pessoa para Annemarie, siga :knows as bordas de cada amigo, siga :likes as bordas dos nós relacionados :Comment e retorne os 100 mais novos desses comentários.

Modelagem e esquema

Os modelos de dados do Graph têm esquema opcional: você pode trabalhar com um esquema fixo quando necessitar de uma governança forte. Alternativamente, é possível evoluir o modelo à medida que novos tipos de nó, relacionamentos ou propriedades surgirem. Essa abordagem reduz a necessidade de duplicação de dados e permite que as equipes unifiquem dados de várias fontes sem uma reformulação inicial pesada.

Usos comuns para bancos de dados de grafo

Os bancos de dados do Graph se alinham estreitamente com domínios em que as conexões geram valor, como redes sociais, grafos de conhecimento, sistemas de recomendação, redes de fraude e risco, topologia de rede e TI e análise de dependência da cadeia de suprimentos. Nesses cenários, as perguntas são menos sobre registros únicos e mais sobre quantas entidades se relacionam e interagem em vários saltos.

Quando considerar um banco de dados de grafo

Escolha um banco de dados de grafo quando suas principais perguntas envolverem caminhos, bairros e padrões em dados conectados; quando o número de saltos é variável ou não é conhecido com antecedência; ou quando você precisar combinar e navegar relações entre conjuntos de dados diferentes. Se essas forem as perguntas que você precisa responder repetidamente, um modelo de grafo será um ajuste natural.

E quanto ao ETL

Representar seus dados como um grafo e armazená-los em um banco de dados de grafo independente separado geralmente introduz a sobrecarga de ETL e governança. Por outro lado, o grafo no Microsoft Fabric opera diretamente no OneLake, o que reduz ou elimina a necessidade de pipelines ETL separados e duplicação de dados. Considere estas compensações:

Movimentação e duplicação de dados: os bancos de dados de grafo autônomos normalmente exigem extrair, transformar e carregar dados (ETL) em um repositório separado, o que aumenta a complexidade e pode levar a conjuntos de dados duplicados. O Graph no Microsoft Fabric opera no OneLake para que você possa modelar e consultar dados conectados sem movê-los.
Custos operacionais: As pilhas de grafos autônomas são executadas como clusters ou serviços separados e geralmente acarretam encargos de capacidade ociosa. As cargas de trabalho em grafos no Fabric consomem CUs (unidades de capacidade em pool) com escalonamento automático para baixo e métricas centralizadas, simplificando assim as operações e potencialmente reduzindo os custos.
Escalabilidade: alguns bancos de dados de grafo autônomos dependem de expansão ou clustering específico do fornecedor. O Graph no Microsoft Fabric foi projetado para grafos em larga escala e usa fragmentação horizontal entre vários trabalhadores para lidar com cargas de trabalho de Big Data com eficiência.
Ferramentas e habilidades: sistemas de grafo específicos do fornecedor podem exigir linguagens especializadas e estruturas de análise separadas. O Graph no Microsoft Fabric fornece modelagem unificada, GQL (consulta baseada em padrões), algoritmos internos de análise de grafo, integração de BI e IA e ferramentas exploratórias de baixo/sem código para que um conjunto mais amplo de usuários possa trabalhar com dados conectados.
Governança e segurança: implantações de grafo separadas precisam de configurações independentes de governança e segurança. O Graph no Microsoft Fabric usa a governança, a linhagem e o RBAC (controle de acesso baseado em função) do OneLake para que a conformidade, a auditoria e as permissões permaneçam consistentes com o restante do ambiente do Fabric.

Comentários

Esta página foi útil?

Last updated on 2025-12-12