Partilhar via


serving-endpoints grupo de comando

Note

Essas informações se aplicam às versões 0.205 e superiores da CLI do Databricks. A CLI do Databricks está em Pré-Visualização Pública.

O uso da CLI do Databricks está sujeito à Licença do Databricks e ao Aviso de Privacidade do Databricks, incluindo quaisquer disposições de Dados de Uso.

O serving-endpoints grupo de comandos dentro da CLI Databricks permite-lhe criar, atualizar e eliminar terminais que servem modelos. Consulte Gerir pontos finais de serviço do modelo.

Databricks serviços de endpoints registos de compilação

Recupere os registos de compilação associados ao modelo servido fornecido.

databricks serving-endpoints build-logs NAME SERVED_MODEL_NAME [flags]

Arguments

NAME

    O nome do endpoint de serviço ao qual pertence o modelo servido. Este campo é obrigatório.

SERVED_MODEL_NAME

    O nome do modelo servido para o qual os logs de compilação serão recuperados. Este campo é obrigatório.

Opções

Bandeiras globais

Criação de pontos de extremidade de serviço Databricks

Crie um novo endpoint de serviço.

databricks serving-endpoints create NAME [flags]

Arguments

NAME

    O nome do endpoint de serviço. Este campo é obrigatório e deve ser exclusivo em um espaço de trabalho Databricks. Um nome de ponto de extremidade pode consistir em caracteres alfanuméricos, traços e sublinhados.

Opções

--budget-policy-id string

    A política de orçamento a aplicar ao ponto de entrega.

--json JSON

    A cadeia de caracteres JSON embutida ou o @path para o arquivo JSON com o corpo da solicitação.

--no-wait

    não espere alcançar o estado NOT_UPDATING

--route-optimized

    Ative a otimização de rota para o endpoint de serviço.

--timeout duration

    tempo máximo para atingir o estado NOT_UPDATING (padrão 20min0s)

Bandeiras globais

Excluir endpoints de serviço no Databricks

Exclua um ponto de extremidade de serviço.

databricks serving-endpoints delete NAME [flags]

Arguments

NAME

    O nome do ponto de extremidade de serviço a ser eliminado.

Opções

Bandeiras globais

Pontos de serviço Databricks exportação de métricas

Recupere as métricas associadas ao endpoint de serviço fornecido no formato de exposição Prometheus ou OpenMetrics.

databricks serving-endpoints export-metrics NAME [flags]

Arguments

NAME

    O nome do endpoint de serviço para o qual recuperar métricas. Este campo é obrigatório.

Opções

Bandeiras globais

Obtenção de pontos de extremidade de serviço no Databricks

Recupere os detalhes de um único ponto de extremidade de serviço.

databricks serving-endpoints get NAME [flags]

Arguments

NAME

    O nome do endpoint de serviço. Este campo é obrigatório.

Opções

Bandeiras globais

Databricks pontos de serviço get-open-api

Obtenha o esquema de consulta do ponto de extremidade de serviço no formato OpenAPI. O esquema contém informações para os caminhos suportados, formato de entrada e saída e tipos de dados.

databricks serving-endpoints get-open-api NAME [flags]

Arguments

NAME

    O nome do endpoint de serviço ao qual pertence o modelo servido. Este campo é obrigatório.

Opções

Bandeiras globais

Lista de pontos de serviço do Databricks

Obtenha todos os endpoints de serviço.

databricks serving-endpoints list [flags]

Arguments

None

Opções

Bandeiras globais

Logs de pontos de extremidade de serviço Databricks

Recupere os logs de serviço associados ao modelo em serviço fornecido.

databricks serving-endpoints logs NAME SERVED_MODEL_NAME [flags]

Arguments

NAME

    O nome do endpoint de serviço ao qual pertence o modelo servido. Este campo é obrigatório.

SERVED_MODEL_NAME

    O nome do modelo que é servido e para o qual os registos serão recuperados. Este campo é obrigatório.

Opções

Bandeiras globais

Correção para Pontos de Servir do Databricks

Adicione ou exclua tags de um endpoint de serviço.

databricks serving-endpoints patch NAME [flags]

Arguments

NAME

    O nome do ponto de extremidade de serviço cujas etiquetas devem ser corrigidas. Este campo é obrigatório.

Opções

--json JSON

    A cadeia de caracteres JSON embutida ou o @path para o arquivo JSON com o corpo da solicitação.

Bandeiras globais

Databricks servindo pontos de extremidade colocados

Atualizar limites de taxa de um ponto de extremidade de serviço.

Note

Obsoleto: por favor, use o AI Gateway para gerir limites de taxa.

databricks serving-endpoints put NAME [flags]

Arguments

NAME

    O nome do ponto de extremidade de serviço cujos limites de taxa estão a ser atualizados. Este campo é obrigatório.

Opções

--json JSON

    A cadeia de caracteres JSON embutida ou o @path para o arquivo JSON com o corpo da solicitação.

Bandeiras globais

Databricks servindo pontos de extremidade put-ai-gateway

Atualize o AI Gateway de um endpoint de atendimento. Modelo externo, taxa de transferência provisionada e pontos de extremidade de pagamento por token são totalmente suportados; Atualmente, os pontos de extremidade do agente suportam apenas tabelas de inferência.

databricks serving-endpoints put-ai-gateway NAME [flags]

Arguments

NAME

    O nome do ponto de extremidade de serviço cujo AI Gateway está sendo atualizado. Este campo é obrigatório.

Opções

--json JSON

    A cadeia de caracteres JSON embutida ou o @path para o arquivo JSON com o corpo da solicitação.

Bandeiras globais

Consulta de endpoints de serviço do Databricks

Consulte um ponto de extremidade de serviço.

databricks serving-endpoints query NAME [flags]

Arguments

NAME

    O nome do endpoint de serviço. Este campo é obrigatório.

Opções

--json JSON

    A cadeia de caracteres JSON embutida ou o @path para o arquivo JSON com o corpo da solicitação.

--max-tokens int

    O campo de tokens máximos é usado APENAS para completações e para modelos externos e de fundação de chat que servem endpoints.

--n int

    O campo n (número de candidatos) é usado APENAS para completions e modelo de chat externo e de base para servir os endpoints.

--stream

    O campo stream é usado APENAS para completações e para o modelo externo e de fundação de chat que serve os endpoints.

--temperature float

    O campo de temperatura é usado APENAS para completações e para o modelo externo e de fundação de chat que serve os endpoints.

Bandeiras globais

databricks pontos de extremidade de serviço atualizar-configuração

Atualize qualquer combinação das entidades servidas do ponto de extremidade de serviço, a configuração de computação dessas entidades atendidas e a configuração de tráfego do ponto de extremidade. Um ponto de extremidade que já tenha uma atualização em andamento não pode ser atualizado até que a atualização atual seja concluída ou falhe.

databricks serving-endpoints update-config NAME [flags]

Arguments

NAME

    O nome do ponto de extremidade de serviço a ser atualizado. Este campo é obrigatório.

Opções

--json JSON

    A cadeia de caracteres JSON embutida ou o @path para o arquivo JSON com o corpo da solicitação.

--no-wait

    não espere alcançar o estado NOT_UPDATING

--timeout duration

    tempo máximo para atingir o estado NOT_UPDATING (padrão 20min0s)

Bandeiras globais

Databricks pontos-de-extremidade-de-serviço obter-níveis-de-permissão

Obtenha os níveis de permissão do ponto de extremidade de serviço.

databricks serving-endpoints get-permission-levels SERVING_ENDPOINT_ID [flags]

Arguments

SERVING_ENDPOINT_ID

    O ponto de extremidade de serviço para o qual obter ou gerenciar permissões.

Opções

Bandeiras globais

Databricks endpoints de serviço obter-permissões

Obtenha permissões de ponto de extremidade de serviço.

Obtém as permissões de um endpoint de serviço. Os pontos de extremidade de serviço podem herdar permissões de seu objeto raiz.

databricks serving-endpoints get-permissions SERVING_ENDPOINT_ID [flags]

Arguments

SERVING_ENDPOINT_ID

    O ponto de extremidade de serviço para o qual obter ou gerenciar permissões.

Opções

Bandeiras globais

Databricks endpoints de serviço definir-permissões

Defina permissões de endpoint de serviço.

databricks serving-endpoints set-permissions SERVING_ENDPOINT_ID [flags]

Arguments

SERVING_ENDPOINT_ID

    O ponto de extremidade de serviço para o qual obter ou gerenciar permissões.

Opções

--json JSON

    A cadeia de caracteres JSON embutida ou o @path para o arquivo JSON com o corpo da solicitação.

Bandeiras globais

Databricks endpoints de serviço atualizar permissões

Atualize as permissões de um endpoint de serviço. Os pontos de extremidade de serviço podem herdar permissões de seu objeto raiz.

databricks serving-endpoints update-permissions SERVING_ENDPOINT_ID [flags]

Arguments

SERVING_ENDPOINT_ID

    O ponto de extremidade de serviço para o qual obter ou gerenciar permissões.

Opções

--json JSON

    A cadeia de caracteres JSON embutida ou o @path para o arquivo JSON com o corpo da solicitação.

Bandeiras globais

Bandeiras globais

--debug

  Se o log de depuração deve ser habilitado.

-h ou --help

    Exiba a ajuda para a CLI do Databricks ou para o grupo de comandos relacionado ou para o comando relacionado.

--log-file string

    Uma cadeia de caracteres que representa o ficheiro onde os registos de saída são gravados. Se esse sinalizador não for especificado, o padrão é gravar logs de saída no stderr.

--log-format Formato

    O tipo de formato de log, text ou json. O valor predefinido é text.

--log-level string

    Uma cadeia de caracteres que representa o nível de formato de log. Se não for especificado, o nível de formato de log será desativado.

-o, --output tipo

    O tipo de saída do comando, text ou json. O valor predefinido é text.

-p, --profile string

    O nome do perfil no arquivo ~/.databrickscfg a ser usado para executar o comando. Se esse sinalizador não for especificado, se ele existir, o perfil nomeado DEFAULT será usado.

--progress-format Formato

    O formato para exibir logs de progresso: default, append, inplace, ou json

-t, --target string

    Se aplicável, o destino do pacote a ser usado