Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Hinweis
Dieser Artikel behandelt Databricks Connect für Databricks Runtime Version 13.3 LTS und höher.
In diesem Artikel wird beschrieben, wie Sie Databricks Connect für Python installieren. Weitere Informationen finden Sie unter Was ist Databricks Connect?.
Anforderungen
Stellen Sie vor der Installation von Databricks Connect sicher, dass Ihr Arbeitsbereich und Ihre lokale Umgebung die Anforderungen erfüllen. Siehe Databricks Connect-Nutzungsanforderungen.
Aktivieren einer Python-virtuellen Umgebung
Databricks empfiehlt dringend, eine virtuelle Python-Umgebung für jede Python-Version zu aktivieren, die Sie mit Databricks Connect verwenden. Mithilfe virtueller Python-Umgebungen kann sichergestellt werden, dass Sie die richtigen Versionen von Python und Databricks Connect zusammen verwenden. Weitere Informationen zu diesen Tools und wie Sie sie aktivieren können, finden Sie unter venv oder Poetry.
Installieren Sie den Databricks Connect-Client
In diesem Abschnitt wird beschrieben, wie Sie den Databricks Connect-Client mit venv oder Poetry installieren.
Hinweis
Wenn Sie die Databricks-Erweiterung für Visual Studio Code bereits installiert haben, können Sie Databricks Connect für Databricks Runtime 13.3 LTS und höher mithilfe der Erweiterung installieren. Siehe Debuggen von Code mithilfe von Databricks Connect für die Databricks-Erweiterung für Visual Studio Code.
Installieren des Databricks Connect-Clients mit venv
Wenn Ihre virtuelle Umgebung aktiviert ist, deinstallieren Sie PySpark, falls es bereits installiert ist, indem Sie den
uninstall-Befehl ausführen. Dieser Schritt ist erforderlich, da dasdatabricks-connect-Paket mit PySpark in Konflikt steht. Weitere Informationen finden Sie unter In Konflikt stehende PySpark-Installationen. Um zu überprüfen, ob PySpark bereits installiert ist, führen Sie denshow-Befehl aus.# Is PySpark already installed? pip3 show pyspark # Uninstall PySpark pip3 uninstall pysparkWenn Ihre virtuelle Umgebung immer noch aktiviert ist, installieren Sie den Databricks Connect-Client, indem Sie den
install-Befehl ausführen. Verwenden Sie die--upgrade-Option, um für alle vorhandenen Clientinstallationen ein Upgrade auf die angegebene Version durchzuführen.pip3 install --upgrade "databricks-connect==16.4.*" # Or X.Y.* to match your cluster version.Hinweis
Databricks empfiehlt, die Notation „Punkt-Sternchen“ anzufügen, um
databricks-connect==X.Y.*anstelle vondatabricks-connect=X.Yanzugeben, um sicherzustellen, dass das neueste Paket installiert ist. Dies ist zwar keine Anforderung, aber es hilft sicherzustellen, dass Sie die aktuellen unterstützten Features für diesen Cluster verwenden können.
Installieren des Databricks Connect-Clients mit Poetry
Wenn Ihre virtuelle Umgebung aktiviert ist, deinstallieren Sie PySpark, falls es bereits installiert ist, indem Sie den
remove-Befehl ausführen. Dieser Schritt ist erforderlich, da dasdatabricks-connect-Paket mit PySpark in Konflikt steht. Weitere Informationen finden Sie unter In Konflikt stehende PySpark-Installationen. Um zu überprüfen, ob PySpark bereits installiert ist, führen Sie denshow-Befehl aus.# Is PySpark already installed? poetry show pyspark # Uninstall PySpark poetry remove pysparkWenn Ihre virtuelle Umgebung immer noch aktiviert ist, installieren Sie den Databricks Connect-Client, indem Sie den
add-Befehl ausführen.poetry add databricks-connect@~16.4 # Or X.Y to match your cluster version.Hinweis
Databricks empfiehlt, die Notation „@-Tilde“ zu verwenden, um
databricks-connect@~16.4anstelle vondatabricks-connect==16.4anzugeben und sicherzustellen, dass das neueste Paket installiert ist. Dies ist zwar keine Anforderung, aber es hilft sicherzustellen, dass Sie die aktuellen unterstützten Features für diesen Cluster verwenden können.