Compartilhar via


Conceitos de pastas do Git no Azure Databricks

As pastas Git do Azure Databricks são um cliente Git visual e uma API que integra repositórios Git em seu workspace. Use pastas Git para desenvolver código em notebooks e arquivos, seguindo as práticas recomendadas de desenvolvimento de software usando o Git para controle de versão, colaboração e CI/CD. As pastas Git dão suporte a operações comuns do Git, como clonar um repositório, fazer commit e push, efetuar pull, gerenciar branches e comparar visualmente os diffs ao fazer commit.

Esta página aborda:

Funcionalidades de pastas do Git

As pastas Git do Azure Databricks fornecem controle do código-fonte para dados e projetos de IA integrando-se a provedores Git.

Use os recursos do Git no workspace do Azure Databricks para:

  • Clonar, enviar por push e efetuar pull de um repositório Git remoto.
  • Crie e gerencie ramificações para o trabalho de desenvolvimento, incluindo mesclagem, rebasing e resolução de conflitos.
  • Crie notebooks, incluindo notebooks IPYNB, edite esses e outros arquivos.
  • Compare visualmente as diferenças ao confirmar e resolva conflitos de mesclagem.

Para obter instruções passo a passo, consulte Executar operações do Git em pastas Git do Databricks.

API de pastas do Git

As pastas Git do Azure Databricks têm uma API para integrar com o pipeline de CI/CD. Por exemplo, atualize programaticamente uma pasta Git do workspace para que ela sempre tenha a versão mais recente do código. Para obter informações sobre as práticas recomendadas para o desenvolvimento de código usando pastas Git do Azure Databricks, consulte CI/CD com pastas Git do Databricks.

Provedores Git

Um provedor Git é um serviço que hospeda um sistema de controle do código-fonte baseado em Git. Essas plataformas vêm em duas formas principais: um serviço de nuvem hospedado pelo fornecedor ou um serviço local que sua organização instala e gerencia em seu próprio hardware. Muitos provedores, incluindo GitHub, Microsoft, GitLab e Atlassian, oferecem opções de SaaS na nuvem e locais (muitas vezes chamadas de "autogerenciadas").

As pastas Git do Azure Databricks usam um repositório Git integrado. Qualquer um dos provedores git corporativos ou de nuvem listados nas seções a seguir pode hospedar o repositório.

Ao selecionar um provedor Git durante a configuração, certifique-se de entender as diferenças entre a nuvem (SaaS) e os sistemas locais. As organizações geralmente hospedam provedores autogerenciados por trás de uma VPN, o que pode torná-los inacessíveis da Internet pública. Essas versões geralmente incluem "Servidor" ou "Autogerenciado" em seus nomes. Se você não tiver certeza de qual sua organização usa, verifique a documentação do provedor ou pergunte aos administradores da sua empresa.

Se o provedor git de nuvem não aparecer na lista de provedores com suporte, escolher o GitHub pode funcionar como um fallback, embora isso não seja garantido.

Observação

Se você estiver usando o GitHub como provedor e ainda não tiver certeza se está usando a nuvem ou a versão local, consulte Sobre o GitHub Enterprise Server nos documentos do GitHub.

Provedores git de nuvem com suporte

As pastas Git do Azure Databricks se integram aos seguintes provedores Git baseados em nuvem:

  • GitHub, GitHub Advanced Enterprise e GitHub Enterprise Cloud
  • Atlassian Bitbucket Cloud
  • GitLab e GitLab Enterprise Edition
  • Microsoft Azure DevOps (Azure Repos)

Provedores Git locais com suporte

As pastas Git do Azure Databricks se integram aos seguintes provedores Git locais:

  • GitHub Enterprise Server
  • Atlassian Bitbucket Server e Data Center
  • Self-Managed do GitLab
  • Microsoft Azure DevOps Server: um administrador de workspace deve permitir explicitamente a lista de prefixos de domínio de URL para o Microsoft Azure DevOps Server se a URL não corresponder dev.azure.com/* ou visualstudio.com/*. Consulte listas de permissões de URL do Git.

Se você estiver integrando um repositório Git local que não esteja acessível pela Internet, também deverá instalar um proxy para solicitações de autenticação git dentro da VPN da sua empresa. Consulte Configurar a conectividade privada do Git para pastas Git do Azure Databricks.

Para saber como usar tokens de acesso com seu provedor Git, consulte Configurar credenciais do Git & conectar um repositório remoto ao Azure Databricks.

Próximas etapas