Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Um modelo de mineração é criado aplicando um algoritmo aos dados, mas é mais do que um algoritmo ou um contêiner de metadados: é um conjunto de dados, estatísticas e padrões que podem ser aplicados a novos dados para gerar previsões e fazer inferências sobre relações.
Esta seção explica o que é um modelo de mineração de dados e para que ele pode ser usado: a arquitetura básica de modelos e estruturas, as propriedades dos modelos de mineração e maneiras de criar e trabalhar com modelos de mineração.
Arquitetura do modelo de mineração
Definindo modelos de mineração de dados
Propriedades do modelo de mineração
Colunas de modelo de mineração
Processando modelos de mineração
Exibindo e consultando modelos de mineração
Arquitetura do modelo de mineração
Um modelo de mineração de dados obtém dados de uma estrutura de mineração e, em seguida, analisa esses dados usando um algoritmo de mineração de dados. A estrutura de mineração e o modelo de mineração são objetos separados. A estrutura de mineração armazena informações que definem a fonte de dados. Um modelo de mineração armazena informações derivadas do processamento estatístico dos dados, como os padrões encontrados como resultado da análise.
Um modelo de mineração fica vazio até que os dados fornecidos pela estrutura de mineração sejam processados e analisados. Depois que um modelo de mineração é processado, ele contém metadados, resultados e associações de volta à estrutura de mineração.
Os metadados especificam o nome do modelo e do servidor onde ele é armazenado, bem como uma definição do modelo, incluindo as colunas da estrutura de mineração que foram usadas na criação do modelo, as definições de todos os filtros que foram aplicados ao processar o modelo e o algoritmo usado para analisar os dados. Todas essas opções- as colunas de dados e seus tipos de dados, filtros e algoritmos têm uma influência poderosa nos resultados da análise.
Por exemplo, você pode usar os mesmos dados para criar vários modelos, usando talvez um algoritmo de clustering, um algoritmo de árvore de decisão e um algoritmo Naïve Bayes. Cada tipo de modelo cria um conjunto diferente de padrões, conjuntos de itens, regras ou fórmulas, que você pode usar para fazer previsões. Geralmente, cada algoritmo analisa os dados de uma maneira diferente, de modo que o conteúdo do modelo resultante também é organizado em estruturas diferentes. Em um tipo de modelo, os dados e os padrões podem ser agrupados em clusters; em outro tipo de modelo, os dados podem ser organizados em árvores, ramificações e regras que os dividem e definem.
O modelo também é afetado pelos dados nos quais você o treina: mesmo modelos treinados na mesma estrutura de mineração podem produzir resultados diferentes se você filtrar os dados de forma diferente ou usar sementes diferentes durante a análise. No entanto, os dados reais não são armazenados no modelo — apenas estatísticas de resumo são armazenadas, enquanto os dados reais residem na estrutura de mineração. Se você tiver criado filtros nos dados ao treinar o modelo, as definições de filtro também serão salvas com o objeto de modelo.
O modelo contém um conjunto de associações, que apontam de volta para os dados armazenados em cache na estrutura de mineração. Se os dados tiverem sido armazenados em cache na estrutura e não tiverem sido limpos após o processamento, essas associações permitirão que você analise os resultados até os casos que dão suporte aos resultados. No entanto, os dados reais são armazenados no cache de estrutura, não no modelo.
Arquitetura do modelo de mineração
Definindo modelos de mineração de dados
Você cria um modelo de mineração de dados seguindo estas etapas gerais:
Crie a estrutura de mineração subjacente e inclua as colunas de dados que podem ser necessárias.
Selecione o algoritmo mais adequado para a tarefa analítica.
Escolha as colunas da estrutura a ser usada no modelo e especifique como elas devem ser usadas- qual coluna contém o resultado que você deseja prever, quais colunas são apenas para entrada e assim por diante.
Opcionalmente, defina parâmetros para ajustar o processamento pelo algoritmo.
Preencha o modelo com dados processando a estrutura e o modelo.
O Analysis Services fornece as seguintes ferramentas para ajudá-lo a gerenciar seus modelos de mineração:
O Assistente de Mineração de Dados ajuda você a criar uma estrutura e um modelo de mineração relacionado. Esse é o método mais fácil de usar. O assistente cria automaticamente a estrutura de mineração necessária e ajuda você com a configuração das configurações importantes.
Uma instrução DMX CREATE MODEL pode ser usada para definir um modelo. A estrutura necessária é criada automaticamente como parte do processo; portanto, você não pode reutilizar uma estrutura existente com esse método. Use esse método se você já souber exatamente qual modelo deseja criar ou se quiser criar modelos de script.
Uma instrução DMX ALTER STRUCTURE ADD MODEL pode ser usada para adicionar um novo modelo de mineração a uma estrutura existente. Use esse método se quiser experimentar modelos diferentes baseados no mesmo conjunto de dados.
Você também pode criar modelos de mineração programaticamente usando AMO ou XML/A ou usando outros clientes, como o Cliente de Mineração de Dados para Excel. Para obter mais informações, consulte os seguintes tópicos:
Arquitetura do modelo de mineração
Propriedades do modelo de mineração
Cada modelo de mineração tem propriedades que definem o modelo e seus metadados. Elas incluem o nome, a descrição, a data em que o modelo foi processado pela última vez, as permissões no modelo e os filtros nos dados usados para treinamento.
Cada modelo de mineração também tem propriedades derivadas da estrutura de mineração e que descrevem as colunas de dados usadas pelo modelo. Se qualquer coluna usada pelo modelo for uma tabela aninhada, a coluna também poderá ter um filtro separado aplicado.
Além disso, cada modelo de mineração contém duas propriedades especiais: Algorithm e Usage.
Propriedade algorithm Especifica o algoritmo usado para criar o modelo. Os algoritmos disponíveis dependem do provedor que você está usando. Para obter uma lista dos algoritmos incluídos no SQL Server Analysis Services, consulte Algoritmos de Mineração de Dados (Analysis Services – Mineração de Dados). A
Algorithmpropriedade se aplica ao modelo de mineração e pode ser definida apenas uma vez para cada modelo. Você pode alterar o algoritmo mais tarde, mas algumas colunas no modelo de mineração poderão se tornar inválidas se não tiverem suporte pelo algoritmo escolhido. É necessário sempre reprocessar o modelo após uma alteração nessa propriedade.Propriedade de uso Define como cada coluna é usada pelo modelo. Você pode definir o uso da coluna como
Input, ,PredictPredict OnlyouKey. AUsagepropriedade se aplica a colunas de modelo de mineração individuais e deve ser definida individualmente para cada coluna incluída em um modelo. Se a estrutura contiver uma coluna que você não usa no modelo, o uso será definido comoIgnore. Exemplos de dados que você pode incluir na estrutura de mineração, mas não usados na análise, podem ser nomes de clientes ou endereços de email. Dessa forma, você pode consultá-los posteriormente sem precisar incluí-los durante a fase de análise.
Você pode alterar o valor das propriedades do modelo de mineração depois de criar um modelo de mineração. No entanto, qualquer alteração, mesmo que seja ao nome do modelo de mineração, requer que você reprocesse o modelo. Depois de reprocessar o modelo, você poderá ver resultados diferentes.
Arquitetura do modelo de mineração
Colunas de modelos de mineração
O modelo de mineração contém colunas de dados obtidas das colunas definidas na estrutura de mineração. Você pode escolher quais colunas da estrutura de mineração usar no modelo e pode criar cópias das colunas da estrutura de mineração e renomeá-las ou alterar seu uso. Como parte do processo de criação do modelo, você também deve definir o uso da coluna pelo modelo. Isso inclui informações como se a coluna é uma chave, se ela é usada para previsão ou se pode ser ignorada pelo algoritmo.
Enquanto você estiver criando um modelo, em vez de adicionar automaticamente todas as colunas de dados disponíveis, é recomendável que você examine os dados na estrutura com cuidado e inclua no modelo apenas as colunas que fazem sentido para análise. Por exemplo, você deve evitar incluir várias colunas que repetem os mesmos dados e você deve evitar o uso de colunas que tenham principalmente valores exclusivos. Se você achar que uma coluna não deve ser usada, não será necessário excluí-la da estrutura de mineração ou do modelo de mineração; Em vez disso, você pode simplesmente definir um sinalizador na coluna que especifica que ele deve ser ignorado ao compilar o modelo. Isso significa que a coluna permanecerá na estrutura de mineração, mas não será usada no modelo de mineração. Se você tiver ativado o drillthrough do modelo para a estrutura de mineração, poderá recuperar posteriormente as informações da coluna.
Dependendo de qual algoritmo você escolher, algumas colunas na estrutura de mineração podem ser incompatíveis com determinados tipos de modelo ou podem fornecer resultados ruins. Por exemplo, se seus dados contiverem dados numéricos contínuos, como uma coluna Renda, e seu modelo exigir valores discretos, talvez seja necessário converter os dados em intervalos discretos ou removê-los do modelo. Em alguns casos, o algoritmo converterá ou armazenará automaticamente os dados para você, mas os resultados podem nem sempre ser o que você quer ou espera. Considere fazer cópias adicionais da coluna e experimentar modelos diferentes. Você também pode definir sinalizadores nas colunas individuais para indicar onde o processamento especial é necessário. Por exemplo, se seus dados contiverem nulos, você poderá usar um sinalizador de modelagem para controlar o tratamento. Se você quiser que uma coluna específica seja considerada como um regressor em um modelo, poderá fazer isso com um sinalizador de modelagem.
Depois de criar o modelo, você pode fazer alterações como adicionar ou remover colunas ou alterar o nome do modelo. No entanto, qualquer alteração, mesmo apenas para os metadados do modelo, requer que você reprocesse o modelo.
Arquitetura do modelo de mineração
Processando modelos de mineração
Um modelo de mineração de dados é um objeto vazio até ser processado. Quando você processa um modelo, os dados armazenados em cache pela estrutura são passados por um filtro, se um tiver sido definido no modelo e analisados pelo algoritmo. O algoritmo calcula um conjunto de estatísticas resumidas que descreve os dados, identifica as regras e padrões dentro dos dados e usa essas regras e padrões para preencher o modelo.
Depois de processado, o modelo de mineração contém uma grande quantidade de informações sobre os dados e os padrões encontrados por meio da análise, incluindo estatísticas, regras e fórmulas de regressão. Você pode usar os visualizadores personalizados para procurar essas informações ou criar consultas de mineração de dados para recuperar essas informações e usá-la para análise e apresentação.
Arquitetura do modelo de mineração
Exibindo e consultando modelos de mineração
Depois de processar um modelo, você pode explorá-lo usando os visualizadores personalizados fornecidos no SSDT (SQL Server Data Tools) e no SQL Server Management Studio. Para
Você também pode criar consultas no modelo de mineração para fazer previsões ou recuperar metadados de modelo ou os padrões criados pelo modelo. Crie consultas usando DMX (Extensões de Mineração de Dados).
Conteúdo relacionado
| Tópicos | Links |
|---|---|
| Saiba como criar estruturas de mineração que podem dar suporte a vários modelos de mineração. Saiba mais sobre o uso de colunas em modelos. |
Colunas da estrutura de mineração Colunas de modelo de mineração Tipos de conteúdo (mineração de dados) |
| Saiba mais sobre algoritmos diferentes e como a escolha do algoritmo afeta o conteúdo do modelo. |
Conteúdo do modelo de mineração (Analysis Services – Mineração de dados) Algoritmos de mineração de dados (Analysis Services – Mineração de Dados) |
| Saiba agora que você pode definir propriedades no modelo que afeta sua composição e comportamento. |
Propriedades do modelo de mineração Sinalizadores de modelagem (mineração de dados) |
| Saiba mais sobre as interfaces programáveis para mineração de dados. |
Desenvolvimento com Objetos de Gerenciamento de Análise (AMO) Referência de DMX (Data Mining Extensions) |
| Saiba como usar os visualizadores de mineração de dados personalizados no Analysis Services. | Visualizadores do modelo de Mineração de dados |
| Exiba exemplos dos diferentes tipos de consultas que você pode usar em modelos de mineração de dados. | Consultas de mineração de dados |
Tarefas Relacionadas
Use os links a seguir para obter informações mais específicas sobre como trabalhar com modelos de mineração de dados
Consulte Também
Objetos de banco de dados (Analysis Services – Dados Multidimensionais)