Compartilhar via


Conteúdo do modelo de mineração para modelos de regressão logística (Analysis Services – Mineração de dados)

Este tópico descreve o conteúdo do modelo de mineração específico para modelos que usam o algoritmo regressão logística da Microsoft. Para obter uma explicação de como interpretar estatísticas e estrutura compartilhadas por todos os tipos de modelo e definições gerais de termos relacionados ao conteúdo do modelo de mineração, consulte Conteúdo do Modelo de Mineração (Analysis Services – Mineração de Dados).

Noções básicas sobre a estrutura de um modelo de regressão logística

Um modelo de regressão logística é criado usando o algoritmo Rede Neural da Microsoft com parâmetros que restringem o modelo para eliminar o nó oculto. Portanto, a estrutura geral de um modelo de regressão logística é quase idêntica à de uma rede neural: cada modelo tem um único nó pai que representa o modelo e seus metadados e um nó de estatísticas marginais especiais (NODE_TYPE = 24) que fornece estatísticas descritivas sobre as entradas usadas no modelo.

Além disso, o modelo contém uma sub-rede (NODE_TYPE = 17) para cada atributo previsível. Assim como em um modelo de rede neural, cada sub-rede sempre contém dois branches: um para a camada de entrada e outro branch que contém a camada oculta (NODE_TYPE = 19) e a camada de saída (NODE_TYPE = 20) para a rede. A mesma subrede poderá ser usada para vários atributos caso sejam especificados como apenas previsão. Atributos previsíveis que também são entradas podem não aparecer na mesma sub-rede.

No entanto, em um modelo de regressão logística, o nó que representa a camada oculta está vazio e não tem filhos. Portanto, o modelo contém nós que representam saídas individuais (NODE_TYPE = 23) e entradas individuais (NODE_TYPE = 21), mas nenhum nó oculto individual.

estrutura de conteúdo para o modelo de regressão logística

Por padrão, um modelo de regressão logística é exibido no Visualizador de Rede Neural da Microsoft. Com esse visualizador personalizado, você pode filtrar os atributos de entrada e seus valores e ver graficamente como eles afetam as saídas. As dicas de ferramenta no visualizador mostram a probabilidade e a elevação associadas a cada combinação de entradas e valores de saída. Para obter mais informações, consulte Procurar um modelo usando o Visualizador de Rede Neural da Microsoft.

Para explorar a estrutura das entradas e sub-redes e ver estatísticas detalhadas, você pode usar o visualizador da Árvore de Conteúdo Genérica da Microsoft. Você pode clicar em qualquer nó para expandi-lo e ver os nós filhos, ou visualizar os pesos e outras estatísticas contidas no nó.

Conteúdo do modelo para um modelo de regressão logística

Esta seção fornece detalhes e exemplos apenas para essas colunas no conteúdo do modelo de mineração que têm relevância específica para regressão logística. O conteúdo do modelo é quase idêntico ao de um modelo de rede neural, mas as descrições que se aplicam a modelos de rede neural podem ser repetidas nesta tabela por conveniência.

Para obter informações sobre colunas de uso geral no conjunto de linhas de esquema, como MODEL_CATALOG e MODEL_NAME, que não são descritas aqui ou para obter explicações sobre a terminologia do modelo de mineração, consulte Conteúdo do Modelo de Mineração (Analysis Services – Mineração de Dados).

CATÁLOGO_DE_MODELOS
Nome do banco de dados em que o modelo é armazenado.

MODEL_NAME
Nome do modelo.

ATTRIBUTE_NAME
Os nomes do atributo que corresponde a esse nó.

Conteúdo
Raiz do modelo Em Branco
Estatísticas marginais Em Branco
Camada de entrada Em Branco
Nó de entrada Nome do atributo de entrada
Camada oculta Em Branco
Camada de saída Em Branco
Nó de saída Nome do atributo de saída

NODE_NAME
O nome do nó. Atualmente, essa coluna contém o mesmo valor que NODE_UNIQUE_NAME, embora isso possa mudar em versões futuras.

NOME_UNICO_DO_NÓ
O nome exclusivo do nó.

Para obter mais informações sobre como os nomes e as IDs fornecem informações estruturais sobre o modelo, consulte a seção Uso de nomes e IDs de nós.

NODE_TYPE
Um modelo de regressão logística produz os seguintes tipos de nó:

ID do tipo de nó Descrição
1 Modelo.
17 Nó de organização para a subrede.
18 Nó organizador para a camada de entrada.
19 Nó organizador para a camada oculta. A camada oculta está vazia.
20 Nó do organizador para a camada de saída.
21 Nó de atributo de entrada.
vinte e três Nó de atributo de saída.
24 Nó de estatísticas marginais.

NODE_CAPTION
Um rótulo ou uma legenda associada ao nó. Em modelos de regressão logística, sempre em branco.

CARDINALIDADE_DOS_FILHOS
Uma estimativa do número de filhos que o nó tem.

Conteúdo
Raiz do modelo Indica a quantidade de nós filhos, que inclui pelo menos 1 rede, 1 nó marginal necessário e 1 camada de entrada necessária. Por exemplo, se o valor for 5, existem três sub-redes.
Estatísticas marginais Sempre 0.
Camada de entrada Indica o número de pares de atributos-valores de entrada que foram usados pelo modelo.
Nó de entrada Sempre 0.
Camada oculta Em um modelo de regressão logística, sempre 0.
Camada de saída Indica o número de valores de saída.
Nó de saída Sempre 0.

PARENT_UNIQUE_NAME
O nome exclusivo do pai do nó. NULL é retornado para quaisquer nós no nível raiz.

Para obter mais informações sobre como os nomes e as IDs fornecem informações estruturais sobre o modelo, veja a seção Usando Nomes e IDs de Nó.

NODE_DESCRIPTION
Uma descrição amigável do nó.

Conteúdo
Raiz do modelo Em Branco
Estatísticas marginais Em Branco
Camada de entrada Em Branco
Nó de entrada Nome do atributo de entrada
Camada oculta Em Branco
Camada de saída Em Branco
Nó de saída Se o atributo de saída for contínuo, conterá o nome do atributo de saída.

Se o atributo de saída for discreto ou discretizado, contém o nome do atributo e o valor.

NODE_RULE
Uma descrição XML da regra que está inserida no nó.

Conteúdo
Raiz do modelo Em Branco
Estatísticas marginais Em Branco
Camada de entrada Em Branco
Nó de entrada Um fragmento XML que contém as mesmas informações que a coluna NODE_DESCRIPTION.
Camada oculta Em Branco
Camada de saída Em Branco
Nó de saída Um fragmento XML que contém as mesmas informações que a coluna NODE_DESCRIPTION.

Regra Marginal
Para modelos de regressão logística, sempre em branco.

PROBABILIDADE_DO_NÓ
A probabilidade associada a esse nó. Para modelos de regressão logística, sempre 0.

Probabilidade Marginal
A probabilidade de atingir o nó a partir do nó pai. Para modelos de regressão logística, sempre 0.

NODE_DISTRIBUTION
Uma tabela aninhada que contém, para o nó, informações estatísticas. Para obter informações detalhadas sobre o conteúdo desta tabela para cada tipo de nó, consulte a seção Compreendendo a Tabela NODE_DISTRIBUTION no Conteúdo do Modelo de Mineração para Modelos de Rede Neural (Analysis Services – Mineração de Dados).

NODE_SUPPORT
Para modelos de regressão logística, sempre 0.

Observação

As probabilidades de suporte são sempre 0 porque a saída desse tipo de modelo não é probabilística. A única coisa que é significativa para o algoritmo são os pesos; portanto, o algoritmo não computa probabilidade, suporte ou variação.

Para obter informações sobre o suporte nos casos de treinamento para valores específicos, consulte o nó de estatísticas marginais.

MSOLAP_MODEL_COLUMN
|Nó|Conteúdo|
|----------|-------------|
|Raiz do modelo|Em branco|
|Estatísticas marginais|Em branco|
|Camada de entrada|Em branco|
|Nó de entrada|Nome do atributo de entrada.|
|Camada oculta|Em branco|
|Camada de saída|Em branco|
|Nó de saída|Nome do atributo de entrada.|

MSOLAP_NODE_SCORE
Em modelos de regressão logística, sempre 0.

MSOLAP_NODE_SHORT_CAPTION
Em modelos de regressão logística, sempre em branco.

Usando nomes de nó e IDs

A nomenclatura dos nós em um modelo de regressão logística fornece informações adicionais sobre as relações entre nós no modelo. A tabela a seguir mostra as convenções para as IDs atribuídas a nós em cada camada.

Tipo de nó Convenção para ID do nó
Raiz do modelo (1) 00000000000000000.
Nó de estatísticas marginais (24) 10000000000000000
Camada de entrada (18) 30000000000000000
Nó de entrada (21) Começa em 60000000000000000000
Sub-rede (17) 20000000000000000
Camada oculta (19) 40000000000000000
Camada de saída (20) 50000000000000000
Nó de saída (23) Começa em 800000000000000000000

Você pode usar essas IDs para determinar como os atributos de saída estão relacionados a atributos de camada de entrada específicos, exibindo a tabela NODE_DISTRIBUTION do nó de saída. Cada linha nessa tabela contém uma ID que aponta de volta para um nó de atributo de entrada específico. A tabela NODE_DISTRIBUTION também contém o coeficiente para esse par de entrada-saída.

Consulte Também

Algoritmo de regressão logística da Microsoft
Conteúdo do modelo de mineração para modelos de rede neural (Analysis Services – Mineração de dados)
Exemplos de consulta de modelo de regressão logística
Referência técnica do algoritmo de regressão logística da Microsoft