Compartilhar via


Conteúdo do modelo de mineração para modelos de associação (Analysis Services – Mineração de dados)

Aplica-se a: SQL Server 2019 e versões anteriores do Analysis Services Azure Analysis Services Fabric/Power BI Premium

Importante

A mineração de dados foi preterida no SQL Server 2017 Analysis Services e agora descontinuada no SQL Server 2022 Analysis Services. A documentação não é atualizada para recursos preteridos e descontinuados. Para saber mais, consulte a compatibilidade com versões anteriores do Analysis Services.

Este tópico descreve o conteúdo do modelo de mineração específico para modelos que usam o algoritmo Regras de Associação da Microsoft. Para obter uma explicação da terminologia geral e estatística relacionada ao conteúdo do modelo de mineração que se aplica a todos os tipos de modelo, consulte Conteúdo do Modelo de Mineração (Analysis Services – Mineração de Dados).

Noções básicas sobre a estrutura de um modelo de associação

Um modelo de associação tem uma estrutura simples. Cada modelo tem um nó pai único que representa o modelo e seus metadados, e cada nó pai tem uma lista simples de conjuntos de itens e regras. Os conjuntos de itens e as regras não são organizados em árvores, eles são ordenados com conjuntos de itens primeiro e as regras a seguir, conforme mostrado no diagrama a seguir.

estrutura de conteúdo do modelo para modelos de associação

Cada conjunto de itens está contido em seu próprio nó (NODE_TYPE = 7). O inclui a definição do conjunto de itens, o número de casos que contêm esse conjunto de itens e outras informações.

Cada regra também está contida em seu próprio nó (NODE_TYPE = 8). Uma regra descreve um padrão geral de como os itens são associados. Uma regra é como uma instrução IF-THEN. O lado esquerdo da regra mostra uma condição ou conjunto de condições existentes. O lado direito da regra mostra o item em seu conjunto de dados que geralmente está associado às condições no lado esquerdo.

Nota Se você quiser extrair as regras ou os conjuntos de itens, poderá usar uma consulta para retornar apenas os tipos de nó desejados. Para obter mais informações, consulte Exemplos de consulta de modelo de associação.

Conteúdo do modelo para um modelo de associação

Esta seção fornece detalhes e exemplos apenas para essas colunas no conteúdo do modelo de mineração relevantes para modelos de associação.

Para obter informações sobre as colunas de uso geral no conjunto de linhas de esquema, como MODEL_CATALOG e MODEL_NAME, consulte Conteúdo do Modelo de Mineração (Analysis Services – Mineração de Dados).

MODEL_CATALOG
Nome do banco de dados em que o modelo é armazenado.

MODEL_NAME
Nome do modelo.

ATTRIBUTE_NAME
Os nomes dos atributos que correspondem a esse nó.

NODE_NAME
O nome do nó. Para um modelo de associação, essa coluna contém o mesmo valor que NODE_UNIQUE_NAME.

NODE_UNIQUE_NAME
O nome exclusivo do nó.

NODE_TYPE
Um modelo de associação produz apenas os seguintes tipos de nó:

ID do tipo de nó Tipo
1 (Modelo) Nó raiz ou nó pai.
7 (Conjunto de itens) Um conjunto de itens ou uma coleção de pares de atributo-valor. Exemplos:

Product 1 = Existing, Product 2 = Existing

or

Gender = Male.
8 (Regra) Uma regra que define como os itens se relacionam entre si.

Exemplo:

Product 1 = Existing, Product 2 = Existing -> Product 3 = Existing.

NODE_CAPTION
Um rótulo ou uma legenda associada ao nó.

Nó do conjunto de itens Uma lista de itens separados por vírgulas.

Nó de regra Contém os lados esquerdo e direito da regra.

CHILDREN_CARDINALITY
Indica a quantidade de filhos no nó atual.

Nó pai Indica o número total de conjuntos de itens e regras.

Observação

Para obter um detalhamento da contagem de conjuntos de itens e regras, consulte o NODE_DESCRIPTION para o nó raiz do modelo.

Conjunto de itens ou nó de regra Sempre 0.

PARENT_UNIQUE_NAME
O nome exclusivo do pai do nó.

Nó pai Sempre NULL.

Conjunto de itens ou nó de regra Sempre 0.

NODE_DESCRIPTION
Uma descrição amigável do conteúdo dos nós.

Nó pai Inclui as seguintes informações sobre o modelo em uma lista separada por vírgulas:

Item Description
ITEMSET_COUNT Contagem de todos os conjuntos de itens no modelo.
CONTAGEM_DE_REGRAS Contagem de todas as regras no modelo.
MIN_SUPPORT O suporte mínimo encontrado para qualquer conjunto de itens único.

Nota Esse valor pode ser diferente do valor definido para o parâmetro _SUPPORT MÍNIMO .
MAX_SUPPORT O suporte máximo encontrado para qualquer conjunto de itens único.

Nota Esse valor pode ser diferente do valor definido para o parâmetro MAXIMUM_SUPPORT .
MIN_ITEMSET_SIZE O tamanho do menor conjunto de itens, representado como uma contagem de itens.

Um valor de 0 indica que o estado Ausente foi tratado como um item independente.

Nota O valor padrão do parâmetro MINIMUM_ITEMSET_SIZE é 1.
MAX_ITEMSET_SIZE Indica o tamanho do maior conjunto de itens encontrado.

Nota Esse valor é restringido pelo valor definido para o parâmetro MAX_ITEMSET_SIZE quando você criou o modelo. Esse valor nunca pode exceder esse valor; no entanto, pode ser menor. O valor padrão é 3.
MIN_PROBABILITY A probabilidade mínima detectada para qualquer conjunto de itens ou regra no modelo.

Exemplo: 0,400390625

Nota Para conjuntos de itens, esse valor é sempre maior do que o valor definido para o parâmetro MINIMUM_PROBABILITY quando você criou o modelo.
MAX_PROBABILITY A probabilidade máxima detectada para qualquer conjunto de itens ou regra no modelo.

Exemplo: 1

Nota Não há parâmetro para restringir a probabilidade máxima de conjuntos de itens. Se você quiser eliminar itens muito frequentes, use o parâmetro MAXIMUM_SUPPORT em vez disso.
MIN_LIFT A quantidade mínima de elevação fornecida pelo modelo para qualquer conjunto de itens.

Exemplo: 0.14309369632511

Observação: saber o elevador mínimo pode ajudá-lo a determinar se o lift para qualquer conjunto de itens é significativo.
MAX_LIFT A quantidade máxima de elevação fornecida pelo modelo para qualquer conjunto de itens.

Exemplo: 1,95758227647523 Observação Saber o lift máximo pode ajudá-lo a determinar se o lift para qualquer conjunto de itens é significativo.

Nó do conjunto de itens Os nós de conjunto de itens contêm uma lista dos itens, exibidos como uma cadeia de caracteres de texto separada por vírgulas.

Exemplo:

Touring Tire = Existing, Water Bottle = Existing

Isso significa que pneus para turismo e garrafas de água foram comprados juntos.

Nó de regra Os nós de regra contêm um lado esquerdo e direito da regra, separados por uma seta.

Exemplo: Touring Tire = Existing, Water Bottle = Existing -> Cycling cap = Existing

Isso significa que se alguém comprou um pneu de passeio e uma garrafa de água, ela também era propensa a comprar um boné de ciclismo.

NODE_RULE
Um fragmento XML que descreve a regra ou o conjunto de itens inserido no nó.

Nó principal Vazio.

Nó do conjunto de itens Vazio.

Nó de regra O fragmento XML inclui informações úteis adicionais sobre a regra, como suporte, confiança e o número de itens e a ID do nó que representa o lado esquerdo da regra.

MARGINAL_RULE
Vazio.

NODE_PROBABILITY
Uma pontuação de probabilidade ou confiança associada ao conjunto de itens ou regra.

Nó pai Sempre 0.

Nó do conjunto de itens Probabilidade do conjunto de itens.

Nó de regra Valor de confiança para a regra.

MARGINAL_PROBABILITY
O mesmo que NODE_PROBABILITY.

NODE_DISTRIBUTION
A tabela contém informações muito diferentes, dependendo de o nó ser um conjunto de itens ou uma regra.

Nó pai Vazio.

Nó do conjunto de itens Lista cada item no conjunto de itens junto com um valor de probabilidade e suporte. Por exemplo, se o conjunto de itens contiver dois produtos, o nome de cada produto será listado, juntamente com a contagem de casos que incluem cada produto.

O Nó de regra contém duas linhas. A primeira linha mostra o atributo do lado direito da regra, que é o item previsto, juntamente com uma pontuação de confiança.

A segunda linha é exclusiva para modelos de associação; ela contém um ponteiro para o itemset no lado direito da regra. O ponteiro é representado na coluna ATTRIBUTE_VALUE como a ID do conjunto de itens que contém apenas o item à direita.

Por exemplo, se a regra for If {A,B} Then {C}, a tabela conterá o nome do item {C}, e a ID do nó que contém o conjunto de itens para o item C.

Esse ponteiro é útil porque você pode determinar no nó do conjunto de itens quantos casos, ao todo, incluem o produto do lado direito. Os casos que estão sujeitos à regra If {A,B} Then {C} são um subconjunto dos casos listados no conjunto de itens para {C}.

NODE_SUPPORT
O número de casos que dão suporte a esse nó.

Nó pai Número de casos no modelo.

Nó do conjunto de itens Número de casos que englobam todos os itens no conjunto.

Nó de regra Número de casos que contêm todos os itens incluídos na regra.

MSOLAP_MODEL_COLUMN
Contém informações diferentes dependendo se o nó é um conjunto de itens ou regra.

Nó pai Vazio.

Itemset node Em branco.

Nó de regra O ID do conjunto de itens que contém os itens na parte esquerda da regra. Por exemplo, se a regra for If {A,B} Then {C}, esta coluna conterá a ID do conjunto de itens que contém apenas {A,B}.

MSOLAP_NODE_SCORE
Nó pai Vazio.

Itemset node Pontuação de importância para o itemset.

Nó de regra Pontuação de importância para a regra.

Observação

A importância é calculada de forma diferente para conjuntos de itens e regras. Para obter mais informações, consulte a Referência Técnica do Algoritmo de Associação da Microsoft.

MSOLAP_NODE_SHORT_CAPTION
Vazio.

Consulte Também

Conteúdo do modelo de mineração (Analysis Services – Mineração de dados)
Algoritmo de Associação da Microsoft
Exemplos de consulta de modelo de associação