Compartilhar via


Grupo de comandos serving-endpoints

Note

Essas informações se aplicam às versões 0.205 e superiores da CLI do Databricks. A CLI do Databricks está em Visualização Pública.

O uso da CLI do Databricks está sujeito à Licença do Databricks e ao Aviso de Privacidade do Databricks, incluindo quaisquer provisionamentos de Dados de Uso.

O serving-endpoints grupo de comandos dentro da CLI do Databricks permite que você crie, atualize e exclua endpoints de servições de modelos. Consulte Gerenciar pontos de extremidade do Serviço de Modelo.

Databricks endpoints-de-serviço logs-de-compilação

Recupere os logs de build associados ao modelo servido.

databricks serving-endpoints build-logs NAME SERVED_MODEL_NAME [flags]

Arguments

NAME

    O nome do endpoint de serviço ao qual o modelo servido pertence. Este campo é necessário.

SERVED_MODEL_NAME

    O nome do modelo fornecido para o qual os logs de build serão recuperados. Este campo é necessário.

Opções

Sinalizadores globais

Databricks criar pontos de acesso de serviço

Crie um novo endpoint de execução.

databricks serving-endpoints create NAME [flags]

Arguments

NAME

    O nome do ponto de extremidade do serviço. Esse campo é necessário e deve ser exclusivo em um workspace do Databricks. Um nome de ponto de extremidade pode consistir em caracteres alfanuméricos, traços e sublinhados.

Opções

--budget-policy-id string

    A política de orçamento a ser aplicada ao ponto de extremidade do serviço.

--json JSON

    A cadeia de caracteres JSON inserida em linha ou o @path para o arquivo JSON com o corpo da solicitação.

--no-wait

    não espere para alcançar o estado NOT_UPDATING

--route-optimized

    Habilitar a otimização de rota em um ponto de extremidade de serviço de modelo.

--timeout duration

    tempo máximo para atingir o estado NOT_UPDATING (padrão 20m 0s)

Sinalizadores globais

Comando databricks serving-endpoints delete

Exclua um endpoint de serviço.

databricks serving-endpoints delete NAME [flags]

Arguments

NAME

    O nome do ponto de extremidade fornecido a ser excluído.

Opções

Sinalizadores globais

pontos-de-serviço-do-databricks exportar-métricas

Recupere as métricas associadas ao ponto de extremidade fornecido no formato de exposição do Prometheus ou OpenMetrics.

databricks serving-endpoints export-metrics NAME [flags]

Arguments

NAME

    O nome do endpoint de serviço para o qual recuperar as métricas. Este campo é necessário.

Opções

Sinalizadores globais

databricks serving-endpoints get

Recupere os detalhes de um único ponto de extremidade do serviço.

databricks serving-endpoints get NAME [flags]

Arguments

NAME

    O nome do ponto de extremidade do serviço. Este campo é necessário.

Opções

Sinalizadores globais

databricks serving-endpoints get-open-api

Obtenha o esquema de consulta do endpoint de serviço no formato OpenAPI. O esquema contém informações para os caminhos com suporte, formato de entrada e saída e tipos de dados.

databricks serving-endpoints get-open-api NAME [flags]

Arguments

NAME

    O nome do endpoint de serviço ao qual o modelo servido pertence. Este campo é necessário.

Opções

Sinalizadores globais

lista de pontos de serviço do Databricks

Obtenha todos os ponto de extremidade do serviço.

databricks serving-endpoints list [flags]

Arguments

None

Opções

Sinalizadores globais

logs de pontos de extremidade de serviço do databricks

Recupere os logs de serviço associados ao modelo fornecido.

databricks serving-endpoints logs NAME SERVED_MODEL_NAME [flags]

Arguments

NAME

    O nome do endpoint de serviço ao qual o modelo servido pertence. Este campo é necessário.

SERVED_MODEL_NAME

    O nome do modelo fornecido para o qual os logs serão recuperados. Este campo é necessário.

Opções

Sinalizadores globais

Patch de endpoints de serviço do Databricks

Adicione ou exclua marcas de um ponto de extremidade do serviço.

databricks serving-endpoints patch NAME [flags]

Arguments

NAME

    O nome do ponto de extremidade do serviço cujas marcas corrigir. Este campo é necessário.

Opções

--json JSON

    A cadeia de caracteres JSON inserida em linha ou o @path para o arquivo JSON com o corpo da solicitação.

Sinalizadores globais

pontos de extremidade de serviço do databricks colocados

Atualize os limites de taxa do endpoint de serviço.

Note

Preterido: use o Gateway de IA para gerenciar os limites de taxa.

databricks serving-endpoints put NAME [flags]

Arguments

NAME

    O nome do ponto de extremidade do serviço cujos limites de taxa estão sendo atualizados. Este campo é necessário.

Opções

--json JSON

    A cadeia de caracteres JSON inserida em linha ou o @path para o arquivo JSON com o corpo da solicitação.

Sinalizadores globais

databricks serving-endpoints put-ai-gateway

Atualize o Gateway de IA de um endpoint de serviço. Modelo externo, taxa de transferência provisionada e pontos de extremidade de pagamento por token são totalmente compatíveis. No momento, os pontos de extremidade do agente só oferecem suporte a tabelas de inferência.

databricks serving-endpoints put-ai-gateway NAME [flags]

Arguments

NAME

    O nome do ponto de extremidade do serviço cujo Gateway de IA está sendo atualizado. Este campo é necessário.

Opções

--json JSON

    A cadeia de caracteres JSON inserida em linha ou o @path para o arquivo JSON com o corpo da solicitação.

Sinalizadores globais

Consulta de endpoints de serviço do Databricks

Consultar um ponto de extremidade do serviço.

databricks serving-endpoints query NAME [flags]

Arguments

NAME

    O nome do ponto de extremidade do serviço. Este campo é necessário.

Opções

--json JSON

    A cadeia de caracteres JSON inserida em linha ou o @path para o arquivo JSON com o corpo da solicitação.

--max-tokens int

    O campo de tokens máximo usado SOMENTE para completamentos e chat externo e modelo base para servir nos pontos de extremidade.

--n int

    O campo n (número de candidatos) usado SOMENTE para completions e chat externo e modelo fundamental servindo pontos de extremidade.

--stream

    O campo de fluxo usado SOMENTE para conclusões e chat externo e modelo de base que atende pontos de extremidade.

--temperature float

    O campo de temperatura usado SOMENTE para conclusões e chat externo e modelo de base que atende pontos de extremidade.

Sinalizadores globais

databricks serving-endpoints update-config

Atualize qualquer combinação das entidades servidas do endpoint de serviço, a configuração de computação dessas entidades servidas e a configuração de tráfego do endpoint. Um endpoint que já tem uma atualização em andamento não pode receber novas atualizações até que a atualização atual seja concluída ou falhe.

databricks serving-endpoints update-config NAME [flags]

Arguments

NAME

    O nome do ponto de extremidade do serviço a ser atualizado. Este campo é necessário.

Opções

--json JSON

    A cadeia de caracteres JSON inserida em linha ou o @path para o arquivo JSON com o corpo da solicitação.

--no-wait

    não espere para alcançar o estado NOT_UPDATING

--timeout duration

    tempo máximo para atingir o estado NOT_UPDATING (padrão 20m 0s)

Sinalizadores globais

databricks serving-endpoints níveis-de-permissão-obter

Obtenha níveis de permissão do ponto de extremidade do serviço.

databricks serving-endpoints get-permission-levels SERVING_ENDPOINT_ID [flags]

Arguments

SERVING_ENDPOINT_ID

    O endpoint de serviço para o qual obter ou gerenciar permissões.

Opções

Sinalizadores globais

permissões de obtenção de pontos de extremidade de serviço do databricks

Obtenha permissões do ponto de extremidade do serviço.

Obtém as permissões de um endpoint de serviço. Os endpoints de serviço podem herdar permissões de seu objeto raiz.

databricks serving-endpoints get-permissions SERVING_ENDPOINT_ID [flags]

Arguments

SERVING_ENDPOINT_ID

    O endpoint de serviço para o qual obter ou gerenciar permissões.

Opções

Sinalizadores globais

Comando "databricks serving-endpoints set-permissions"

Defina permissões do ponto de extremidade do serviço.

databricks serving-endpoints set-permissions SERVING_ENDPOINT_ID [flags]

Arguments

SERVING_ENDPOINT_ID

    O endpoint de serviço para o qual obter ou gerenciar permissões.

Opções

--json JSON

    A cadeia de caracteres JSON inserida em linha ou o @path para o arquivo JSON com o corpo da solicitação.

Sinalizadores globais

databricks atualiza-permissões de pontos-de-serviço

Atualize as permissões de um endpoint de serviço. Os endpoints de serviço podem herdar permissões de seu objeto raiz.

databricks serving-endpoints update-permissions SERVING_ENDPOINT_ID [flags]

Arguments

SERVING_ENDPOINT_ID

    O endpoint de serviço para o qual obter ou gerenciar permissões.

Opções

--json JSON

    A cadeia de caracteres JSON inserida em linha ou o @path para o arquivo JSON com o corpo da solicitação.

Sinalizadores globais

Sinalizadores globais

--debug

  Indica se deve habilitar o registro em log de depuração.

-h ou --help

    Exiba ajuda para a CLI do Databricks ou o grupo de comandos relacionado ou o comando relacionado.

--log-file corda

    Uma cadeia de caracteres que representa o arquivo para o qual gravar logs de saída. Se esse sinalizador não for especificado, o padrão será gravar logs de saída no stderr.

--log-format formato

    O tipo de formato de log, text ou json. O valor padrão é text.

--log-level corda

    Uma cadeia de caracteres que representa o nível de formato de log. Se não for especificado, o nível de formato de log será desabilitado.

-o, --output tipo

    O tipo de saída de comando, text ou json. O valor padrão é text.

-p, --profile corda

    O nome do perfil no arquivo ~/.databrickscfg para usar ao executar o comando. Se esse sinalizador não for especificado, se existir, o perfil nomeado DEFAULT será usado.

--progress-format formato

    O formato para exibir logs de progresso: default, append, inplace ou json

-t, --target corda

    Se aplicável, o destino do pacote a ser usado