Freigeben über


Erstellen eines Arbeitsbereichs

Dieser Artikel enthält eine Übersicht über Ihre Optionen zum Erstellen und Verwalten von Arbeitsbereichen.

Was ist ein Arbeitsbereich?

Ein Arbeitsbereich ist eine Azure Databricks-Bereitstellung in einem Clouddienstkonto. Er bietet eine einheitliche Umgebung für die Arbeit mit Azure Databricks-Ressourcen für eine bestimmte Gruppe von Benutzern.

Es stehen zwei Arten von Databricks-Arbeitsbereichen zur Verfügung:

  • Serverlose Arbeitsbereiche (öffentliche Vorschau): Eine Arbeitsbereichsbereitstellung in Ihrem Databricks-Konto, die mit serverlosem Compute und Standardspeicher vorkonfiguriert ist, um eine völlig serverlose Erfahrung zu bieten. Sie können weiterhin über serverlose Arbeitsbereiche eine Verbindung mit Ihrem Cloudspeicher herstellen.
  • Klassische Arbeitsbereiche: Eine Arbeitsbereichsbereitstellung in Ihrem Databricks-Konto, die Speicher- und Computeressourcen in Ihrem vorhandenen Cloud-Konto bereitstellt. Serverlose Berechnung ist weiterhin in klassischen Arbeitsbereichen verfügbar.

Anforderungen

Bevor Sie einen Azure Databricks-Arbeitsbereich erstellen, müssen Sie über ein Azure-Abonnement verfügen, das kein kostenloses Testabonnement ist.

Wenn Sie über ein kostenloses Konto verfügen, führen Sie die folgenden Schritte aus:

  1. Rufen Sie Ihr Profil auf, und ändern Sie Ihr Abonnement in Nutzungsbasierte Bezahlung. Weitere Informationen finden Sie unter Kostenloses Azure-Konto.
  2. Entfernen Sie das Ausgabenlimit.
  3. Fordern Sie eine Kontingenterhöhung für vCPUs in Ihrer Region an.

Erforderliche Azure-Berechtigungen

Um einen Azure Databricks-Arbeitsbereich zu erstellen, müssen Sie eine der folgenden Sein:

  • Ein Benutzer mit der Azure-Rolle Contributor oder Owner auf Abonnementebene.

  • Ein Benutzer mit einer benutzerdefinierten Rollendefinition mit der folgenden Berechtigungsliste:

    • Microsoft.Databricks/workspaces/*
    • Microsoft.Resources/subscriptions/resourceGroups/read
    • Microsoft.Resources/subscriptions/resourceGroups/write
    • Microsoft.Databricks/accessConnectors/*
    • Microsoft.Compute/register/action
    • Microsoft.ManagedIdentity/register/action
    • Microsoft.Storage/register/action
    • Microsoft.Network/register/action
    • Microsoft.Resources/deployments/validate/action
    • Microsoft.Resources/deployments/write
    • Microsoft.Resources/deployments/read

Hinweis

Die Berechtigungen Microsoft.Compute/register/action, Microsoft.ManagedIdentity/register/action, Microsoft.Storage/register/action, Microsoft.Network/register/action sind nicht erforderlich, wenn diese Anbieter bereits im Abonnement registriert sind. Siehe Resource Provider registrieren.

Auswählen eines Arbeitsbereichstyps

In den folgenden Abschnitten wird beschrieben, welcher Arbeitsbereichstyp für häufige Anwendungsfälle am besten geeignet ist. Verwenden Sie diese Empfehlungen, um zu entscheiden, ob Sie einen serverlosen oder klassischen Arbeitsbereich bereitstellen sollten.

Wann sollen serverlose Arbeitsbereiche ausgewählt werden?

Serverlose Arbeitsbereiche sind die beste Wahl für die folgenden Anwendungsfälle:

  • Ermöglichen des Zugriffs auf Databricks One für Geschäftsbenutzer
  • Erstellen von AI/BI-Dashboards
  • Erstellen von Databricks-Apps
  • Durchführen explorativer Analysen mithilfe von Notizbüchern oder SQL-Lagerhäusern
  • Herstellen einer Verbindung mit SaaS-Anbietern über lakehouse Federation (aber nicht Lakeflow Connect)
  • Verwenden von Genie Spaces für Geschäftsanwendungsfälle
  • Testen Sie neue Mosaik-KI-Features, bevor Sie sie in die Produktion umstellen
  • Erstellen von serverlosen Lakeflow Spark Declarative Pipelines

Wann sie klassische Arbeitsbereiche auswählen möchten

Klassische Arbeitsbereiche sind die beste Wahl für die folgenden Anwendungsfälle:

  • Ausführen von KI- oder ML-Entwicklungsarbeiten, für die GPUs erforderlich sind
  • Verwenden von Databricks Runtime für Maschinelles Lernen oder Apache Spark MLib
  • Vorhandenen Legacy-Spark-Code, der Spark RDDs verwendet, portieren.
  • Verwenden von Scala oder R als primäre Codierungssprache
  • Streamdaten, die Standard- oder zeitbasierte Triggerintervalle erfordern
  • Verbinden Sie sich über eine PrivateLink-Verbindung mit den Databricks-APIs.
  • Direktes Herstellen einer Verbindung mit lokalen Systemen oder privaten Datenbanken über Lakeflow Connect

Optionen für die Arbeitsbereichserstellung

Es gibt mehrere Möglichkeiten zum Bereitstellen eines Azure Databricks-Arbeitsbereichs. Die Standardbereitstellungsmethode erfolgt über das Azure-Portal oder Terraform.

Darüber hinaus können Sie Arbeitsbereiche mit den folgenden Tools erstellen: