Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Grupo de comandos
Note
Essas informações se aplicam às versões 0.205 e superiores da CLI do Databricks. A CLI do Databricks está em Visualização Pública.
O uso da CLI do Databricks está sujeito à Licença do Databricks e ao Aviso de Privacidade do Databricks, incluindo quaisquer provisionamentos de Dados de Uso.
O serving-endpoints grupo de comandos dentro da CLI do Databricks permite que você crie, atualize e exclua endpoints de servições de modelos. Consulte Gerenciar pontos de extremidade do Serviço de Modelo.
Databricks endpoints-de-serviço logs-de-compilação
Recupere os logs de build associados ao modelo servido.
databricks serving-endpoints build-logs NAME SERVED_MODEL_NAME [flags]
Arguments
NAME
O nome do endpoint de serviço ao qual o modelo servido pertence. Este campo é necessário.
SERVED_MODEL_NAME
O nome do modelo fornecido para o qual os logs de build serão recuperados. Este campo é necessário.
Opções
Databricks criar pontos de acesso de serviço
Crie um novo endpoint de execução.
databricks serving-endpoints create NAME [flags]
Arguments
NAME
O nome do ponto de extremidade do serviço. Esse campo é necessário e deve ser exclusivo em um workspace do Databricks. Um nome de ponto de extremidade pode consistir em caracteres alfanuméricos, traços e sublinhados.
Opções
--budget-policy-id string
A política de orçamento a ser aplicada ao ponto de extremidade do serviço.
--json JSON
A cadeia de caracteres JSON inserida em linha ou o @path para o arquivo JSON com o corpo da solicitação.
--no-wait
não espere para alcançar o estado NOT_UPDATING
--route-optimized
Habilitar a otimização de rota em um ponto de extremidade de serviço de modelo.
--timeout duration
tempo máximo para atingir o estado NOT_UPDATING (padrão 20m 0s)
Comando databricks serving-endpoints delete
Exclua um endpoint de serviço.
databricks serving-endpoints delete NAME [flags]
Arguments
NAME
O nome do ponto de extremidade fornecido a ser excluído.
Opções
pontos-de-serviço-do-databricks exportar-métricas
Recupere as métricas associadas ao ponto de extremidade fornecido no formato de exposição do Prometheus ou OpenMetrics.
databricks serving-endpoints export-metrics NAME [flags]
Arguments
NAME
O nome do endpoint de serviço para o qual recuperar as métricas. Este campo é necessário.
Opções
databricks serving-endpoints get
Recupere os detalhes de um único ponto de extremidade do serviço.
databricks serving-endpoints get NAME [flags]
Arguments
NAME
O nome do ponto de extremidade do serviço. Este campo é necessário.
Opções
databricks serving-endpoints get-open-api
Obtenha o esquema de consulta do endpoint de serviço no formato OpenAPI. O esquema contém informações para os caminhos com suporte, formato de entrada e saída e tipos de dados.
databricks serving-endpoints get-open-api NAME [flags]
Arguments
NAME
O nome do endpoint de serviço ao qual o modelo servido pertence. Este campo é necessário.
Opções
lista de pontos de serviço do Databricks
Obtenha todos os ponto de extremidade do serviço.
databricks serving-endpoints list [flags]
Arguments
None
Opções
logs de pontos de extremidade de serviço do databricks
Recupere os logs de serviço associados ao modelo fornecido.
databricks serving-endpoints logs NAME SERVED_MODEL_NAME [flags]
Arguments
NAME
O nome do endpoint de serviço ao qual o modelo servido pertence. Este campo é necessário.
SERVED_MODEL_NAME
O nome do modelo fornecido para o qual os logs serão recuperados. Este campo é necessário.
Opções
Patch de endpoints de serviço do Databricks
Adicione ou exclua marcas de um ponto de extremidade do serviço.
databricks serving-endpoints patch NAME [flags]
Arguments
NAME
O nome do ponto de extremidade do serviço cujas marcas corrigir. Este campo é necessário.
Opções
--json JSON
A cadeia de caracteres JSON inserida em linha ou o @path para o arquivo JSON com o corpo da solicitação.
pontos de extremidade de serviço do databricks colocados
Atualize os limites de taxa do endpoint de serviço.
Note
Preterido: use o Gateway de IA para gerenciar os limites de taxa.
databricks serving-endpoints put NAME [flags]
Arguments
NAME
O nome do ponto de extremidade do serviço cujos limites de taxa estão sendo atualizados. Este campo é necessário.
Opções
--json JSON
A cadeia de caracteres JSON inserida em linha ou o @path para o arquivo JSON com o corpo da solicitação.
databricks serving-endpoints put-ai-gateway
Atualize o Gateway de IA de um endpoint de serviço. Modelo externo, taxa de transferência provisionada e pontos de extremidade de pagamento por token são totalmente compatíveis. No momento, os pontos de extremidade do agente só oferecem suporte a tabelas de inferência.
databricks serving-endpoints put-ai-gateway NAME [flags]
Arguments
NAME
O nome do ponto de extremidade do serviço cujo Gateway de IA está sendo atualizado. Este campo é necessário.
Opções
--json JSON
A cadeia de caracteres JSON inserida em linha ou o @path para o arquivo JSON com o corpo da solicitação.
Consulta de endpoints de serviço do Databricks
Consultar um ponto de extremidade do serviço.
databricks serving-endpoints query NAME [flags]
Arguments
NAME
O nome do ponto de extremidade do serviço. Este campo é necessário.
Opções
--json JSON
A cadeia de caracteres JSON inserida em linha ou o @path para o arquivo JSON com o corpo da solicitação.
--max-tokens int
O campo de tokens máximo usado SOMENTE para completamentos e chat externo e modelo base para servir nos pontos de extremidade.
--n int
O campo n (número de candidatos) usado SOMENTE para completions e chat externo e modelo fundamental servindo pontos de extremidade.
--stream
O campo de fluxo usado SOMENTE para conclusões e chat externo e modelo de base que atende pontos de extremidade.
--temperature float
O campo de temperatura usado SOMENTE para conclusões e chat externo e modelo de base que atende pontos de extremidade.
databricks serving-endpoints update-config
Atualize qualquer combinação das entidades servidas do endpoint de serviço, a configuração de computação dessas entidades servidas e a configuração de tráfego do endpoint. Um endpoint que já tem uma atualização em andamento não pode receber novas atualizações até que a atualização atual seja concluída ou falhe.
databricks serving-endpoints update-config NAME [flags]
Arguments
NAME
O nome do ponto de extremidade do serviço a ser atualizado. Este campo é necessário.
Opções
--json JSON
A cadeia de caracteres JSON inserida em linha ou o @path para o arquivo JSON com o corpo da solicitação.
--no-wait
não espere para alcançar o estado NOT_UPDATING
--timeout duration
tempo máximo para atingir o estado NOT_UPDATING (padrão 20m 0s)
databricks serving-endpoints níveis-de-permissão-obter
Obtenha níveis de permissão do ponto de extremidade do serviço.
databricks serving-endpoints get-permission-levels SERVING_ENDPOINT_ID [flags]
Arguments
SERVING_ENDPOINT_ID
O endpoint de serviço para o qual obter ou gerenciar permissões.
Opções
permissões de obtenção de pontos de extremidade de serviço do databricks
Obtenha permissões do ponto de extremidade do serviço.
Obtém as permissões de um endpoint de serviço. Os endpoints de serviço podem herdar permissões de seu objeto raiz.
databricks serving-endpoints get-permissions SERVING_ENDPOINT_ID [flags]
Arguments
SERVING_ENDPOINT_ID
O endpoint de serviço para o qual obter ou gerenciar permissões.
Opções
Comando "databricks serving-endpoints set-permissions"
Defina permissões do ponto de extremidade do serviço.
databricks serving-endpoints set-permissions SERVING_ENDPOINT_ID [flags]
Arguments
SERVING_ENDPOINT_ID
O endpoint de serviço para o qual obter ou gerenciar permissões.
Opções
--json JSON
A cadeia de caracteres JSON inserida em linha ou o @path para o arquivo JSON com o corpo da solicitação.
databricks atualiza-permissões de pontos-de-serviço
Atualize as permissões de um endpoint de serviço. Os endpoints de serviço podem herdar permissões de seu objeto raiz.
databricks serving-endpoints update-permissions SERVING_ENDPOINT_ID [flags]
Arguments
SERVING_ENDPOINT_ID
O endpoint de serviço para o qual obter ou gerenciar permissões.
Opções
--json JSON
A cadeia de caracteres JSON inserida em linha ou o @path para o arquivo JSON com o corpo da solicitação.
Sinalizadores globais
--debug
Indica se deve habilitar o registro em log de depuração.
-h ou --help
Exiba ajuda para a CLI do Databricks ou o grupo de comandos relacionado ou o comando relacionado.
--log-file corda
Uma cadeia de caracteres que representa o arquivo para o qual gravar logs de saída. Se esse sinalizador não for especificado, o padrão será gravar logs de saída no stderr.
--log-format formato
O tipo de formato de log, text ou json. O valor padrão é text.
--log-level corda
Uma cadeia de caracteres que representa o nível de formato de log. Se não for especificado, o nível de formato de log será desabilitado.
-o, --output tipo
O tipo de saída de comando, text ou json. O valor padrão é text.
-p, --profile corda
O nome do perfil no arquivo ~/.databrickscfg para usar ao executar o comando. Se esse sinalizador não for especificado, se existir, o perfil nomeado DEFAULT será usado.
--progress-format formato
O formato para exibir logs de progresso: default, append, inplace ou json
-t, --target corda
Se aplicável, o destino do pacote a ser usado