Compartilhar via


Conteúdo do modelo de mineração para modelos de série temporal (Analysis Services – Mineração de dados)

Todos os modelos de mineração usam a mesma estrutura para armazenar seu conteúdo. Essa estrutura é definida de acordo com o conjunto de linhas do esquema de conteúdo de mineração de dados. No entanto, dentro dessa estrutura padrão, os nós que contêm informações são organizados de maneiras diferentes para representar vários tipos de árvores. Este tópico descreve como os nós são organizados e o que cada nó significa para modelos de mineração baseados no algoritmo Microsoft Time Series.

Para obter uma explicação do conteúdo geral do modelo de mineração que se aplica a todos os tipos de modelo, consulte Conteúdo do Modelo de Mineração (Analysis Services – Mineração de Dados).

Ao revisar este tópico, você pode achar útil acompanhar navegando o conteúdo de um modelo de série temporal. Você pode criar um modelo de série temporal concluindo o tutorial de Mineração de Dados Básico. O modelo criado no tutorial é um modelo misto que treina dados usando os algoritmos ARIMA e ARTXP. Para obter mais informações, consulte Criando uma estrutura de previsão e um modelo (Tutorial de mineração de dados intermediário). Para obter informações sobre como exibir o conteúdo de um modelo de mineração, consulte Visualizadores de Modelo de Mineração de Dados.

Noções básicas sobre a estrutura de um modelo de série temporal

Um modelo de série temporal tem um único nó pai que representa o modelo e seus metadados. Abaixo desse nó pai, há uma ou duas árvores de série temporal, dependendo do algoritmo que você usou para criar o modelo.

Se você criar um modelo misto, duas árvores separadas serão adicionadas ao modelo, uma para ARIMA e outra para ARTXP. Se você optar por usar apenas o algoritmo ARTXP ou apenas o algoritmo ARIMA, terá uma única árvore que corresponda a esse algoritmo. Especifique qual algoritmo usar definindo o parâmetro FORECAST_METHOD. Para obter mais informações sobre se deseja usar ARTXP, ARIMA ou um modelo misto, consulte o Algoritmo de Série Temporal da Microsoft.

O diagrama a seguir mostra um exemplo de um modelo de mineração de dados de série temporal que foi criado com as configurações padrão, para criar um modelo misto. Para que você possa comparar mais facilmente as diferenças entre os dois modelos, aqui o modelo ARTXP é mostrado no lado esquerdo do diagrama e o modelo ARIMA é mostrado no lado direito do diagrama. Enquanto ARTXP é uma estrutura semelhante a uma árvore que se divide em ramificações menores e menores, a estrutura criada pelo algoritmo ARIMA é mais como uma pirâmide criada para cima a partir de componentes menores.

Estrutura do conteúdo do modelo para modelos de série temporal

O ponto importante a ser lembrado é que as informações são organizadas dentro das árvores ARIMA e ARTXP de maneiras completamente diferentes, e você deve considerar as duas árvores como relacionadas somente no nó raiz. Embora as duas representações sejam apresentadas em um modelo para conveniência, elas devem ser tratadas como dois modelos independentes. ARTXP representa uma estrutura de árvore real, mas ARIMA não.

Quando você usa o Visualizador de Modelos Genéricos da Microsoft para visualizar um modelo que inclui ARIMA e ARTXP, os nós desses modelos são apresentados como nós subordinados do modelo principal de série temporal. No entanto, você pode diferenciá-los facilmente pelos rótulos aplicados aos nós.

  • O primeiro conjunto de nós é rotulado (Todos) e representa os resultados da análise pelo algoritmo ARTXP.

  • O segundo conjunto de nós é rotulado como ARIMA e representa os resultados da análise pelo algoritmo ARIMA.

Aviso

O nome (All) na árvore ARTXP é mantido apenas para compatibilidade com versões anteriores. Antes do SQL Server 2008, o algoritmo Time Series usava um único algoritmo para análise, o algoritmo ARTXP.

As seções a seguir explicam como os nós são organizados dentro de cada um desses tipos de modelo.

Estrutura de um modelo ARTXP

O algoritmo ARTXP cria um modelo semelhante a um modelo de árvores de decisão. Ele agrupa atributos previsíveis e os divide sempre que diferenças significativas são encontradas. Portanto, cada modelo ARTXP contém um branch separado para cada atributo previsível. Por exemplo, o tutorial de Mineração de Dados Básico cria um modelo que prevê a quantidade de vendas para várias regiões. Nesse caso, [Amount] é o atributo previsível e um branch separado é criado para cada região. Se você tivesse dois atributos previsíveis, [Amount] e [Quantity], um branch separado seria criado para cada combinação de um atributo e uma região.

O nó superior do branch ARTXP contém as mesmas informações que estão em um nó raiz da árvore de decisão. Isso inclui o número de filhos para esse nó (CHILDREN_CARDINALITY), o número de casos que atendem às condições desse nó (NODE_SUPPORT) e uma variedade de estatísticas descritivas (NODE_DISTRIBUTION).

Se o nó não tiver filhos, isso significa que não foram encontradas condições significativas que justifiquem a divisão dos casos em outros subgrupos. O ramo termina neste ponto e o nó é chamado de nó folha. O nó folha contém os atributos, os coeficientes e os valores que são os elementos fundamentais da fórmula ARTXP.

Alguns ramos podem ter divisões adicionais, semelhantes a um modelo de árvore de decisão. Por exemplo, o galho da árvore que representa as vendas na região da Europa divide-se em dois galhos. Uma divisão ocorre quando uma condição é encontrada que causa uma diferença significativa entre os dois grupos. O nó pai informa o nome do atributo que causou a divisão, como [Valor], e quantos casos existem no nó pai. Os nós de folha fornecem mais detalhes: valor do atributo, como [Vendas] >10.000 vs. [Vendas] < 10.000, o número de casos que dão suporte a cada condição e a fórmula ARTXP.

Observação

Se você quiser exibir as fórmulas, poderá encontrar a fórmula de regressão completa no nível do nó folha, mas não em um nó intermediário ou raiz.

Estrutura de um modelo ARIMA

O algoritmo ARIMA cria uma única informação para cada combinação de uma série de dados (como [Região]) e um atributo previsível (como [Valor de Vendas])- a equação que descreve a alteração do atributo previsível ao longo do tempo.

A equação para cada série é derivada de vários componentes, um para cada estrutura periódica encontrada nos dados. Por exemplo, se você tiver dados de vendas coletados mensalmente, o algoritmo poderá detectar estruturas periódicas mensais, trimestrais ou anuais.

O algoritmo produz conjuntos separados de nós pai e filho para cada periodicidade que encontra. A periodicidade padrão é 1, para uma única fatia de tempo e é adicionada automaticamente a todos os modelos. Você pode especificar possíveis estruturas periódicas inserindo vários valores no parâmetro PERIODICITY_HINT. No entanto, se o algoritmo não detectar uma estrutura periódica, ele não produzirá resultados para essa dica.

Cada estrutura periódica gerada no conteúdo do modelo contém os seguintes nós de componente:

  • Um nó para a ordem autoregressiva (AR)

  • Um nó para a média móvel (MA)

Para obter informações sobre o significado desses termos, consulte o Algoritmo de Série Temporal da Microsoft.

A ordem de diferença é uma parte importante da fórmula e é representada na equação. Para obter mais informações sobre como a ordem de diferença é usada, consulte a Referência Técnica do Algoritmo de Série Temporal da Microsoft.

Conteúdo de Modelo para Séries Temporais

Esta seção fornece detalhes e exemplos apenas para essas colunas no conteúdo do modelo de mineração que têm relevância específica para modelos de série temporal.

Para obter informações sobre colunas de uso geral no conjunto de linhas de esquema, como MODEL_CATALOG e MODEL_NAME, ou para obter explicações sobre a terminologia do modelo de mineração, consulte Conteúdo do modelo de mineração (Analysis Services – Data Mining).

CATÁLOGO_DE_MODELOS
Nome do banco de dados em que o modelo é armazenado.

MODEL_NAME
Nome do modelo.

ATTRIBUTE_NAME
O atributo previsível para a série de dados representada no nó. (O mesmo valor de MSOLAP_MODEL_COLUMN.)

NODE_NAME
O nome do nó.

Atualmente, essa coluna contém o mesmo valor que NODE_UNIQUE_NAME, embora isso possa mudar em versões futuras.

NOME_UNICO_DO_NÓ
O nome exclusivo do nó. O nó pai do modelo é sempre chamado TS.

ARTXP: Cada nó é representado por TS seguido por um valor numérico hexadecimal. A ordem dos nós não é importante.

Por exemplo, os nós ARTXP diretamente na árvore TS podem ser numerados TS00000001-TS000000b.

ARIMA: Cada nó de uma árvore ARIMA é representado por TA seguido de um valor numérico hexadecimal. Os nós filho contêm o nome exclusivo do nó pai seguido por outro número hexadecimal que indica a sequência dentro do nó.

Todas as árvores ARIMA são estruturadas exatamente da mesma forma. Cada raiz contém os nós e a convenção de nomenclatura exemplificadas na tabela a seguir:

ID e tipo do nó ARIMA Exemplo de nome de nó
Raiz ARIMA (27) TA0000000b
Estrutura Periódica arima (28) TA0000000b000000000
Autoregressivo ARIMA (29) TA0000000b00000000000
Média Móvel ARIMA (30) TA0000000b0000000001

NODE_TYPE
Um modelo de série temporal gera os seguintes tipos de nós, dependendo do algoritmo.

ARTXP:

ID do tipo de nó Descrição
1 (Modelo) Série temporal
3 (Interior) Representa um ramo interior em uma árvore de série temporal ARTXP.
16 (árvore de série temporal) Raiz da árvore ARTXP que corresponde a um atributo e uma série previsíveis.
15 (Série temporal) Um nó folha na árvore ARTXP.

ARIMA:

ID do tipo de nó Descrição
27 (Raiz ARIMA) O nó superior de uma árvore ARIMA.
28 (Estrutura Periódica ARIMA) Componente de uma árvore ARIMA que descreve uma única estrutura periódica.
29 (ARIMA Autoregressive) Contém um coeficiente para uma única estrutura periódica.
30 (ARIMA Média Móvel) Contém um coeficiente para uma única estrutura periódica.

NODE_CAPTION
Um rótulo ou uma legenda associado ao nó.

Essa propriedade é principalmente para fins de exibição.

ARTXP: Contém a condição de divisão do nó, exibida como uma combinação de atributo e intervalo de valor.

ARIMA: Contém a forma curta da equação ARIMA.

Para obter informações sobre o formato da equação ARIMA, consulte a Legenda de Mineração para ARIMA.

CARDINALIDADE_DOS_FILHOS
O número de filhos diretos que o nó tem.

NOME_ÚNICO_PAI
O nome exclusivo do pai do nó. NULL é retornado para quaisquer nós no nível raiz.

DESCRIÇÃO_DO_NODO
Uma descrição textual das regras, divisões ou fórmulas no nó atual.

ARTXP: Para obter mais informações, consulte Noções básicas sobre a árvore ARTXP.

ARIMA: Para obter mais informações, consulte Noções básicas sobre a árvore ARIMA.

NODE_RULE
Uma descrição XML das regras, divisões ou fórmulas no nó atual.

ARTXP: O NODE_RULE geralmente corresponde ao NODE_CAPTION.

ARIMA: Para obter mais informações, consulte Noções básicas sobre a árvore ARIMA.

Regra Marginal
Uma descrição XML da divisão ou do conteúdo específico a esse nó.

ARTXP: O MARGINAL_RULE geralmente corresponde ao NODE_DESCRIPTION.

ARIMA: Sempre em branco; em vez disso, use NODE_RULE.

PROBABILIDADE_DO_NÓ
ARTXP: Para nós de árvore, sempre 1. Para nós folhas, a probabilidade de atingir um nó a partir do nó raiz do modelo.

ARIMA: Sempre 0.

Probabilidade Marginal
ARTXP: Para nós de árvore, sempre 1. Para nós folhas, a probabilidade de atingir o nó a partir do nó pai imediato.

ARIMA: Sempre 0.

DISTRIBUIÇÃO_DE_NÓDULOS
Uma tabela que ilustra o histograma de probabilidade do nó. Em um modelo de série temporal, essa tabela aninhada contém todos os componentes necessários para montar a fórmula de regressão real.

Para obter mais informações sobre a tabela de distribuição de nós em uma árvore ARTXP, consulte Noções básicas sobre a árvore ARTXP.

Para obter mais informações sobre a tabela de distribuição de nós em uma árvore ARIMA, consulte Noções básicas sobre a árvore ARIMA.

Se você quiser ver todas as constantes e outros componentes compostos em um formato legível, use o Visualizador de Séries Temporais, clique no nó e abra a Legenda de Mineração.

NODE_SUPPORT
O número de casos que oferecem suporte a este nó.

ARTXP: Para o nó (Todos) indica o número total de fatias de tempo incluídas na ramificação.

Para nós de terminal, indica o número de fatias de tempo incluídas no intervalo descrito por NODE_CAPTION. O número de fatias de tempo nos nós terminais sempre soma-se ao valor NODE_SUPPORT do nó da ramificação (Todos).

ARIMA: Uma contagem de casos que dão suporte à estrutura periódica atual. O valor de suporte é repetido em todos os nós da estrutura periódica atual.

MSOLAP_MODEL_COLUMN
O atributo previsível para as séries de dados representadas no nó. (O mesmo valor de ATTRIBUTE_NAME.)

MSOLAP_NODE_SCORE
Um valor numérico que caracteriza o valor das informações da árvore ou divisão.

ARTXP: O valor sempre é 0,0 para nós não divididos. Para os nós com uma divisão, o valor representa a pontuação de interesse da divisão.

Para obter mais informações sobre métodos de pontuação, consulte Seleção de Recursos (Mineração de Dados).

ARIMA: A pontuação BIC (Critério de Informações Bayesiana) do modelo ARIMA. A mesma pontuação é definida em todos os nós ARIMA relacionados à equação.

MSOLAP_NODE_SHORT_CAPTION
ARTXP: As mesmas informações que o NODE_DESCRIPTION.

ARIMA: As mesmas informações que o NODE_CAPTION: ou seja, a forma curta da equação ARIMA.

Noções básicas sobre a árvore ARTXP

O modelo ARTXP separa claramente as áreas dos dados que são lineares das áreas dos dados que se dividem em algum outro fator. Onde quer que as alterações no atributo previsível possam ser representadas diretamente como uma função das variáveis independentes, uma fórmula de regressão é calculada para representar essa relação

Por exemplo, se houver uma correlação direta entre o tempo e as vendas para a maior parte das séries de dados, cada série será contida em uma árvore de séries temporais (NODE_TYPE =16), sem nós filhos para cada série, apenas uma equação de regressão. No entanto, se a relação não for linear, uma árvore ARTXP de série temporal pode se dividir em nós filhos com base em condições, assim como um modelo de árvore de decisão. Ao exibir o conteúdo do modelo no Visualizador de Árvore de Conteúdo Genérico da Microsoft , você pode ver onde as divisões ocorrem e como ela afeta a linha de tendência.

Para entender melhor esse comportamento, você pode examinar o modelo de série temporal criado no Tutorial Básico de Mineração de Dados. Esse modelo, baseado no data warehouse adventureworks, não usa dados particularmente complexos. Portanto, não há muitas divisões na árvore ARTXP. No entanto, mesmo esse modelo relativamente simples ilustra três tipos diferentes de divisões:

  • A linha de tendência [Quantidade] para a região do Pacífico se divide na chave temporal. Uma divisão na chave de tempo significa que há uma mudança na tendência em um determinado momento. A linha de tendência era linear apenas até um determinado ponto e, em seguida, a curva assumiu uma forma diferente. Por exemplo, uma série temporal pode continuar até 6 de agosto de 2002 e outra série temporal iniciar após essa data.

  • A linha de tendência de [Valor] para a região da América do Norte é dividida por outra variável. Nesse caso, a tendência para a América do Norte se divide com base no valor do mesmo modelo na Europa. Em outras palavras, o algoritmo detectou que, quando o valor da Europa é alterado, o valor para a América do Norte A também é alterado.

  • A linha de tendência para a região da Europa se divide em si mesma.

O que significa cada divisão? Interpretar as informações transmitidas pelo conteúdo do modelo é uma arte que requer uma compreensão profunda dos dados e seu significado no contexto de negócios.

  • A aparente ligação entre as tendências para as regiões da América do Norte e da Europa pode significar apenas que a série de dados para a Europa tem mais entropia, o que faz com que a tendência para a América do Norte pareça mais fraca. Ou, pode não haver diferença significativa na pontuação para os dois, e a correlação pode ser acidental, com base simplesmente na computação da Europa antes de calcular a América do Norte. No entanto, talvez você queira examinar os dados e verificar se a correlação é falsa ou investigar para ver se algum outro fator pode estar envolvido.

  • A divisão na chave de tempo significa que há uma alteração estatisticamente significativa no gradiente da linha. Isso pode ter sido causado por fatores matemáticos, como o suporte para cada intervalo ou os cálculos de entropia necessários para a divisão. Portanto, essa divisão pode não ser interessante em termos do significado do modelo no mundo real. No entanto, ao examinar o período de tempo indicado na divisão, você pode encontrar correlações interessantes que não estão representadas nos dados, como uma promoção de vendas ou outro evento que começou naquele momento e que podem ter afetado os dados.

Se os dados contivessem outros atributos, provavelmente você veria exemplos mais interessantes de ramificação na árvore. Por exemplo, se você rastreou as informações meteorológicas e as usou como um atributo para análise, poderá ver várias divisões na árvore que representam a interação complexa de vendas e clima.

Em suma, a mineração de dados é útil para fornecer dicas sobre onde ocorrem fenômenos potencialmente interessantes, mas uma investigação mais aprofundada e a experiência dos usuários empresariais são necessárias para interpretar com precisão o valor das informações no contexto.

Elementos da fórmula de série temporal ARTXP

Para exibir a fórmula completa de uma árvore ou ramo ARTXP, recomendamos que você use a Legenda de Mineração do Microsoft Time Series Viewer, que apresenta todas as constantes em um formato legível.

A seção a seguir apresenta uma equação de exemplo e explica os termos básicos.

Legenda de mineração para uma fórmula ARTXP

O exemplo a seguir mostra a fórmula ARTXP para uma parte do modelo, conforme exibido na Legenda de Mineração. Para exibir essa fórmula, abra o modelo [Previsão] criado no Tutorial Básico de Mineração de Dados no visualizador do Microsoft Time Series, clique na guia Modelo e selecione a árvore para a série de dados R250: Europa.

Para exibir a equação usada para este exemplo, clique no nó que representa a série de datas em ou após 5/7/2003.

Exemplo de equação de nó de árvore:

Quantidade = 21,322

-0,293 * Quantidade(R250 América do Norte,-7) + 0,069 * Quantidade(R250 Europa,-1) + 0,023 *

Quantity(R250 Europe,-3) -0,142 * Quantity(R750 Europe,-8)

Nesse caso, o valor 21.322 representa o valor previsto para Quantidade como uma função dos seguintes elementos da equação.

Por exemplo, um elemento é Quantity(R250 North America,-7). Essa notação significa a quantidade para a região da América do Norte em t-7, ou sete fatias de tempo antes da fatia de tempo atual. O valor dessa série de dados é multiplicado pelo coeficiente -0,293. O coeficiente para cada elemento é derivado durante o processo de treinamento e é baseado em tendências nos dados.

Há vários elementos nessa equação porque o modelo calculou que a quantidade do modelo R250 na região da Europa depende dos valores de várias outras séries de dados.

Conteúdo do modelo para uma fórmula ARTXP

A tabela a seguir mostra as mesmas informações para a fórmula, usando o conteúdo do nó relevante, conforme exibido no Visualizador de Árvore de Conteúdo Genérico da Microsoft (Mineração de Dados).

ATTRIBUTE_NAME ATTRIBUTE_VALUE APOIO PROBABILIDADE VARIAÇÃO TIPODEVALOR
Quantidade(R250 Europe, intercepto y) 21.3223433563772 11 0 1.65508795539661 11 (Intercepto)
Quantidade(R250 Europa,-1) 0.0691694140876526 0 0 0 7 (Coeficiente)
Quantidade(R250 Europe,-1) 20.6363635858123 0 0 182.380682874818 9 (Estatísticas)
Quantidade(R750 Europe,-8) -0.1421203048299 0 0 0 7 (Coeficiente)
Quantidade(R750 Europa,-8) 22.5454545333019 0 0 104.362130048408 9 (Estatísticas)
Quantidade(R250 Europa,-3) 0.0234095979448281 0 0 0 7 (Coeficiente)
Quantidade(R250 Europa,-3) 24.8181818883176 0 0 176,475304989169 9 (Estatísticas)
Quantity(R250 América do Norte,-7) -0.292914186039869 0 0 0 7 (Coeficiente)
Quantity(R250 América do Norte,-7) 10.36363640433 0 0 701.882534898676 9 (Estatísticas)

Como você pode ver comparando esses exemplos, o conteúdo do modelo de mineração contém as mesmas informações disponíveis na Legenda de Mineração, mas com colunas adicionais para variação e suporte. O valor do suporte indica a contagem de casos que dão suporte à tendência descrita por essa equação.

Usando a fórmula de série temporal ARTXP

Para a maioria dos usuários corporativos, o valor do conteúdo do modelo ARTXP é que ele combina uma exibição de árvore e uma representação linear dos dados.

  • Se as alterações no atributo previsível puderem ser representadas como uma função linear das variáveis independentes, o algoritmo computará automaticamente a equação de regressão e a saída dessa série em um nó separado

  • Sempre que a relação não pode ser expressa como uma correlação linear, a série temporal se ramifica como uma árvore de decisão.

Ao navegar pelo conteúdo do modelo no Microsoft Time Series Viewer , você pode ver onde a divisão ocorre e como ela afeta a linha de tendência.

Se houver uma correlação direta entre o tempo e as vendas de qualquer parte da série de dados, a maneira mais fácil de obter a fórmula é copiar a fórmula da Legenda de Mineração e colá-la em um documento ou apresentação para ajudar a explicar o modelo. Como alternativa, você pode extrair a média, o coeficiente e outras informações da tabela NODE_DISTRIBUTION dessa árvore e usá-la para calcular extensões da tendência. Se a série inteira demonstrar uma relação linear consistente, a equação estará contida no nó (Todos). Se houver alguma ramificação na árvore, a equação estará contida no nó de folha.

A consulta a seguir retorna todos os nós folha ARTXP de um modelo de mineração, acompanhados pela tabela aninhada NODE_DISTRIBUTION, que contém a equação.

SELECT MODEL_NAME, ATTRIBUTE_NAME, NODE_NAME,  
NODE_CAPTION,   
(SELECT ATTRIBUTE_NAME, ATTRIBUTE_VALUE, [VARIANCE], VALUETYPE  
FROM NODE_DISTRIBUTION) as t  
FROM Forecasting.CONTENT  
WHERE NODE_TYPE = 15  

Noções básicas sobre a árvore ARIMA

Cada estrutura em um modelo ARIMA corresponde a uma periodicidade ou estrutura periódica. Uma estrutura periódica é um padrão de dados que se repete ao longo da série de dados. Algumas pequenas variações no padrão são permitidas, dentro dos limites estatísticos. A periodicidade é medida de acordo com as unidades de tempo padrão usadas nos dados de treinamento. Por exemplo, se os dados de treinamento fornecerem dados de vendas para cada dia, a unidade de tempo padrão será um dia e todas as estruturas periódicas serão definidas como um número especificado de dias.

Cada período detectado pelo algoritmo recebe o seu próprio nó de estrutura. Por exemplo, se você estiver analisando dados diários de vendas, o modelo poderá detectar estruturas periódicas que representam semanas. Nesse caso, o algoritmo criará duas estruturas periódicas no modelo concluído: uma para o período diário padrão, indicada como {1}, e outra por semanas, indicada por {7}.

Por exemplo, a consulta a seguir retorna todas as estruturas ARIMA de um modelo de mineração.

SELECT MODEL_NAME, ATTRIBUTE_NAME, NODE_NAME, NODE_CAPTION  
FROM Forecasting.CONTENT  
WHERE NODE_TYPE = 27  

Resultados do exemplo:

MODEL_NAME ATTRIBUTE_NAME NODE_NAME NODE_TYPE NODE_CAPTION
Previsão M200 Europe:Quantidade TA00000000 27 ARIMA (1,0,1)
Previsão M200 América do Norte:Quantidade TA00000001 27 ARIMA (1,0,4) X (1,1,4)(6)
Previsão M200 Pacific:Quantidade TA00000002 27 ARIMA (2,0,8) X (1,0,0)(4)
Previsão M200 Pacific: Quantidade TA00000002 27 ARIMA (2,0,8) X (1,0,0)(4)
Previsão R250 Europa:Quantidade TA00000003 27 ARIMA (1,0,7)
Previsão R250 América do Norte: Quantidade TA00000004 27 ARIMA (1,0,2)
Previsão R250 Pacific:Quantidade TA00000005 27 ARIMA (2,0,2) X (1,1,2)(12)
Previsão R750 Europa:Quantidade TA00000006 27 ARIMA (2,1,1) X (1,1,5)(6)
Previsão T1000 Europa:Quantidade TA00000009 27 ARIMA (1,0,1)
Previsão T1000 América do Norte:Quantidade TA0000000a 27 ARIMA (1,1,1)
Previsão T1`000 Pacific:Quantity TA0000000b 27 ARIMA (1,0,3)

Nesses resultados, que você também pode navegar usando o Visualizador de Árvore de Conteúdo Genérico da Microsoft (Mineração de Dados), você pode informar rapidamente quais séries são completamente lineares, que têm várias estruturas periódicas e quais são as periodicidades descobertas.

Por exemplo, a forma curta da equação ARIMA para a série M200 Europe informa que apenas o ciclo padrão ou diário foi detectado. A forma curta da equação é fornecida na coluna NODE_CAPTION.

No entanto, para a série M200 na América do Norte, foi encontrada uma estrutura periódica adicional. O nó TA00000001 tem dois nós filho, um com a equação, (1,0,4) e outro com a equação, (1,1,4)(6). Essas equações são concatenadas e apresentadas no nó pai.

Para cada estrutura periódica, o conteúdo do modelo também fornece a ordem e a média móvel como nós filho. Por exemplo, a consulta a seguir obtém os nós filhos de um dos nós listados no exemplo anterior. Observe que a coluna, PARENT_UNIQUE_NAME, deve estar entre colchetes para distingui-la da palavra-chave reservada de mesmo nome.

SELECT *   
FROM Forecasting.CONTENT  
WHERE [PARENT_UNIQUE_NAME] = ' TA00000001'  

Como esta é uma árvore ARIMA, não uma árvore ARTXP, você não pode usar a função IsDescendant (DMX) para retornar os nós filho dessa estrutura periódica. Em vez disso, você pode usar os tipos de atributo e nó para filtrar os resultados e retornar os nós-filhos que fornecem mais detalhes sobre como a equação foi criada, incluindo as médias móveis e a ordem de diferenciação.

SELECT MODEL_NAME, ATTRIBUTE_NAME, NODE_UNIQUE_NAME,  
NODE_TYPE,  NODE_CAPTION  
FROM Forecasting.CONTENT  
WHERE [MSOLAP_MODEL_COLUMN] ='M200 North America:Quantity'  
AND (NODE_TYPE = 29 or NODE_TYPE = 30)  

Resultados do exemplo:

MODEL_NAME ATTRIBUTE_NAME NOME_UNICO_DO_NÓ NODE_TYPE NODE_CAPTION
Previsão M200 América do Norte:Quantidade TA00000001000000010 29 ARIMA {1,0.961832044807041}
Previsão M200 América do Norte:Quantidade TA00000001000000011 30 ARIMA {1,-3.51073103693271E-02,2.15731642954099,-0.220314343327742,-1.33151478258758}
Previsão M200 América do Norte:Quantidade TA00000001000000000 29 ARIMA {1,0.643565911081657}
Previsão M200 América do Norte:Quantidade TA00000001000000001 30 ARIMA {1,1.45035399809581E-02,-4.40489283927752E-02,-0.19203901352577,0.242202497643993}

Estes exemplos ilustram que, quanto mais você se aprofunda na árvore ARIMA, mais detalhes são revelados, sendo que as informações importantes também são combinadas e apresentadas no nó principal.

Fórmula de série temporal para ARIMA

Para exibir a fórmula completa para qualquer nó ARIMA, recomendamos que você use a Legenda de Mineração do Visualizador de Séries Temporais da Microsoft, que apresenta a ordem autoregressiva, médias móveis e outros elementos da equação já compostos em um formato consistente.

Esta seção apresenta uma equação de exemplo e explica os termos básicos.

Legenda de mineração para fórmula ARIMA

O exemplo a seguir mostra a fórmula ARIMA para uma parte do modelo, conforme exibido na Legenda de Mineração. Para exibir essa fórmula, abra o modelo de Previsão usando o visualizador do Microsoft Time Series, clique na guia Modelo , selecione a árvore para a série de dados R250: Europa e clique no nó que representa a série de datas em ou após 5/07/2003. A legenda de mineração compõe todas as constantes em um formato legível, mostrado neste exemplo:

Equação ARIMA:

ARIMA ({1,1},0,{1,1.49791920964142,1.10640053499397,0.888873034670339,-5.05429403071953E-02,-0.905265316720334,-0.961908900643379,-0.649991020901922}) Intercept:56.8888888888889

Essa equação é o formato ARIMA longo, que inclui os valores dos coeficientes e o intercepto. O formato curto para essa equação seria {1,0,7}, em que 1 indica o período como uma contagem de fatias de tempo, 0 indica a ordem de diferença de termos e 7 indica o número de coeficientes.

Observação

Uma constante é calculada pelo Analysis Services para variação de computação, mas a constante em si não é exibida em nenhum lugar na interface do usuário. No entanto, você poderá exibir a variação de qualquer ponto da série como uma função dessa constante se selecionar Mostrar Desvios, no modo gráfico . O tooltip para cada série de dados mostra a variação de um ponto específico previsto.

Modelo de Conteúdo para Fórmula ARIMA

Um modelo ARIMA segue uma estrutura padrão, com informações diferentes contidas em nós de diferentes tipos. Para exibir o conteúdo do modelo ARIMA, altere o visualizador para o Visualizador de Árvore de Conteúdo Genérico da Microsoft e expanda o nó que tem o nome do atributo R250 Europa: Quantidade.

Um modelo ARIMA para uma série de dados contém a equação periódica básica em quatro formatos diferentes, que você pode escolher dependendo do aplicativo.

NODE_CAPTION: Exibe o formato curto da equação. O formato curto informa quantas estruturas periódicas são representadas e quantos coeficientes elas têm. Por exemplo, se o formato curto da equação for {4,0,6}, o nó representará uma estrutura periódica, com seis coeficientes. Se o formato curto for algo como {2,0,8} x {1,0,0}(4), o nó conterá duas estruturas periódicas.

DESCRIÇÃO DO NÓ: Exibe o formato longo da equação, que também é a forma da equação que aparece na Legenda de Mineração. A forma longa da equação é semelhante à forma curta, exceto que os valores reais dos coeficientes são exibidos em vez de serem contados.

NODE_RULE: Exibe uma representação XML da equação. Dependendo do tipo de nó, a representação XML pode incluir estruturas periódicas simples ou múltiplas. A tabela a seguir ilustra como os nós XML são agregados para níveis mais altos do modelo ARIMA.

Tipo de nó Conteúdo XML
27 (Raiz ARIMA) Inclui todas as estruturas periódicas da série de dados e o conteúdo de todos os nós subordinados para cada estrutura periódica.
28 (Estrutura Periódica ARIMA) Define uma única estrutura periódica, incluindo seu nó de termo autoregressivo e seus coeficientes médios móveis.
29 (ARIMA Autoregressive) Lista os termos de uma única estrutura periódica.
30 (ARIMA Média Móvel) Lista os coeficientes para uma única estrutura periódica.

NODE_DISTRIBUTION: Exibe os termos da equação em uma tabela aninhada, que você pode consultar para obter termos específicos. A tabela de distribuição de nós segue a mesma estrutura hierárquica que as regras XML. Ou seja, o nó raiz da série ARIMA (NODE_TYPE = 27) contém o valor de interceptação e as periodicidades para a equação completa, que pode incluir várias periodicidades, enquanto os nós filho contêm apenas informações específicas para uma determinada estrutura periódica ou para os nós filho dessa estrutura periódica.

Tipo de nó Atributo Tipo de valor
27 (Raiz ARIMA) Interceptar

Periodicidade
11
28 (Estrutura Periódica ARIMA) Periodicidade

Ordem regressiva automática

Ordem de diferença

Ordem média móvel
12

13

15

14
29 (ARIMA Autoregressive) Coeficiente

(complemento do coeficiente)
7
30 (ARIMA Média Móvel) Valor no instante t

Valor em t-1

...

Valor em t-n
7

O valor da ordem média móvel indica o número de médias móveis em uma série. Geralmente, a média móvel é calculada n-1 vezes se houver n termos em uma série, mas o número pode ser reduzido para uma computação mais fácil.

O valor da ordem autoregressiva indica o número de séries autoregressivas.

O valor da ordem de diferença indica quantas vezes a série é comparada ou diferenciada.

Para obter uma enumeração dos tipos de valor possíveis, consulte Microsoft.AnalysisServices.AdomdServer.MiningValueType.

Usando as informações da árvore ARIMA

Se você usar previsões baseadas no algoritmo ARIMA em uma solução de negócios, convém colar a equação em um relatório para demonstrar o método usado para criar a previsão. Você pode usar a legenda para apresentar as fórmulas em formato curto ou a descrição para apresentar as fórmulas em formato longo.

Se você estiver desenvolvendo um aplicativo que usa previsões de série temporal, talvez seja útil obter a equação ARIMA do conteúdo do modelo e, em seguida, fazer suas próprias previsões. Para obter a equação ARIMA para qualquer saída específica, você pode consultar a raiz ARIMA para esse atributo específico diretamente, conforme mostrado nos exemplos anteriores.

Se você souber a ID do nó que contém a série desejada, terá duas opções para recuperar os componentes da equação:

  • Formato de tabela aninhada: use uma consulta DMX ou consulte via cliente OLEDB.

  • Representação XML: use uma consulta XML.

Observações

Pode ser difícil recuperar informações de uma árvore ARTXP, pois as informações para cada divisão estão em um lugar diferente dentro da árvore. Portanto, com um modelo ARTXP, você deve obter todas as peças e, em seguida, fazer algum processamento para reconstituir a fórmula completa. Recuperar uma equação de um modelo ARIMA é mais fácil porque a fórmula foi disponibilizada em toda a árvore. Para obter informações sobre como criar uma consulta para recuperar essas informações, consulte exemplos de consulta de modelo de série temporal.

Consulte Também

Conteúdo do modelo de mineração (Analysis Services – Mineração de dados)
Algoritmo de Série Temporal da Microsoft
Exemplos de consulta de modelo de série temporal
Referência técnica do algoritmo de série temporal da Microsoft