Freigeben über


Inhalt des Miningmodells für Logistische Regressionsmodelle

Gilt für: SQL Server 2019 und frühere Analysis Services Azure Analysis Services Fabric/Power BI Premium

Von Bedeutung

Data Mining wurde in SQL Server 2017 Analysis Services verworfen und ist in SQL Server 2022 Analysis Services eingestellt worden. Die Dokumentation wird nicht für veraltete und nicht mehr unterstützte Features aktualisiert. Weitere Informationen finden Sie unter "Analysis Services-Abwärtskompatibilität".

In diesem Thema werden Miningmodellinhalte beschrieben, die spezifisch für Modelle sind, die den Microsoft Logistic Regression-Algorithmus verwenden. Eine Erläuterung dazu, wie Statistiken und Struktur interpretiert werden, die von allen Modelltypen gemeinsam genutzt werden, sowie allgemeine Definitionen von Begriffen im Zusammenhang mit Miningmodellinhalten finden Sie unter Mining Model Content (Analysis Services - Data Mining).

Grundlegendes zur Struktur eines Logistischen Regressionsmodells

Ein logistisches Regressionsmodell wird mithilfe des Microsoft Neural Network-Algorithmus mit Parametern erstellt, die das Modell einschränken, um den ausgeblendeten Knoten zu beseitigen. Daher ist die Gesamtstruktur eines logistischen Regressionsmodells fast identisch mit dem eines neuralen Netzwerks: Jedes Modell verfügt über einen einzelnen übergeordneten Knoten, der das Modell und seine Metadaten darstellt, und einen speziellen Randstatistikknoten (NODE_TYPE = 24), der beschreibende Statistiken zu den im Modell verwendeten Eingaben bereitstellt.

Darüber hinaus enthält das Modell ein Subnetz (NODE_TYPE = 17) für jedes vorhersagbare Attribut. Genau wie in einem neuralen Netzwerkmodell enthält jedes Subnetz immer zwei Verzweigungen: eine für die Eingabeebene und eine andere Verzweigung, die die ausgeblendete Ebene (NODE_TYPE = 19) und die Ausgabeebene (NODE_TYPE = 20) für das Netzwerk enthält. Dasselbe Subnetz kann für mehrere Attribute verwendet werden, wenn sie als "nur vorhergesagt" angegeben werden. Vorhersehbare Attribute, die auch Eingaben sind, werden möglicherweise nicht in demselben Subnetz angezeigt.

In einem logistischen Regressionsmodell ist der Knoten, der die versteckte Schicht darstellt, leer und besitzt keine Nachfolger. Daher enthält das Modell Knoten, die einzelne Ausgaben (NODE_TYPE = 23) und einzelne Eingaben (NODE_TYPE = 21) darstellen, jedoch keine einzelnen ausgeblendeten Knoten.

Struktur für ein logistisches Regressionsmodell

Standardmäßig wird ein Logistisches Regressionsmodell im Microsoft Neural Network Viewer angezeigt. Mit diesem benutzerdefinierten Viewer können Sie nach Eingabeattributen und deren Werten filtern und grafisch sehen, wie sie sich auf die Ausgaben auswirken. Die QuickInfos im Viewer zeigen Ihnen die Wahrscheinlichkeit und den Hebewert, die jedem Eingabe- und Ausgabewertepaar zugeordnet sind. Weitere Informationen finden Sie unter Durchsuchen eines Modells mithilfe des Microsoft Neural Network Viewers.

Um die Struktur der Eingaben und Subnetze zu untersuchen und detaillierte Statistiken anzuzeigen, können Sie den Microsoft Generic Content Tree Viewer verwenden. Sie können auf einen beliebigen Knoten klicken, um ihn zu erweitern und die untergeordneten Knoten anzuzeigen, oder die Gewichtungen und andere Im Knoten enthaltene Statistiken anzeigen.

Modellinhalt für ein Logistisches Regressionsmodell

Dieser Abschnitt enthält Details und Beispiele nur für die Spalten im Miningmodellinhalt, die eine besondere Relevanz für die logistische Regression haben. Der Modellinhalt ist fast identisch mit dem eines neuralen Netzwerkmodells, aber Beschreibungen, die für neurale Netzwerkmodelle gelten, können in dieser Tabelle zur Vereinfachung wiederholt werden.

Informationen zu allgemeinen Spalten im Schema-Rowset, z. B. MODEL_CATALOG und MODEL_NAME, die hier nicht beschrieben werden, oder erläuterungen der Miningmodellterminologie finden Sie unter Mining Model Content (Analysis Services - Data Mining).

Modellkatalog
Name der Datenbank, in der das Modell gespeichert ist.

MODEL_NAME
Name des Modells.

ATTRIBUTE_NAME
Die Namen des Attributs, das diesem Knoten entspricht.

Node Content
Modellstamm Leerzeichen
Marginalstatistik Leerzeichen
Eingabeebene Leerzeichen
Eingabeknoten Eingabeattribut-Name
Verborgene Schicht Leerzeichen
Ausgabeebene Leerzeichen
Ausgabeknoten Ausgabe-Attributname

NODE_NAME
Der Name des Knotens. Derzeit enthält diese Spalte den gleichen Wert wie NODE_UNIQUE_NAME, obwohl sich dies in zukünftigen Versionen ändern kann.

NODE_UNIQUE_NAME
Der eindeutige Name des Knotens.

Weitere Informationen dazu, wie die Namen und IDs strukturelle Informationen zum Modell bereitstellen, finden Sie im Abschnitt "Verwenden von Knotennamen und IDs".

NODE_TYPE
Ein logistisches Regressionsmodell gibt die folgenden Knotentypen aus:

Knotentyp-ID Description
1 Model.
17 Organisatorknoten für das Subnetz.
18 Organisatorknoten für die Eingabeebene.
19 Organisationsknoten für die versteckte Schicht. Die ausgeblendete Schicht ist leer.
20 Organisatorknoten für die Ausgabeebene.
21 Eingabe-Attributknoten.
23 Attributausgabeknoten.
24 Knoten für Randstatistiken.

NODE_CAPTION
Eine Beschriftung oder ein Untertitel, der dem Knoten zugeordnet ist. In logistischen Regressionsmodellen immer leer.

KINDER_KARDINALITÄT
Eine Schätzung der Anzahl der Kinder, die ein Knoten hat.

Node Content
Modellstamm Gibt die Anzahl der untergeordneten Knoten an, die mindestens 1 Netzwerk, 1 erforderlicher Randknoten und 1 erforderliche Eingabeebene umfasst. Wenn der Wert beispielsweise 5 ist, gibt es 3 Subnetze.
Marginalstatistik Immer 0.
Eingabeebene Gibt die Anzahl der Vom Modell verwendeten Eingabeattribute-Werte-Paare an.
Eingabeknoten Immer 0.
Verborgene Schicht In einem logistischen Regressionsmodell immer 0.
Ausgabeebene Gibt die Anzahl der Ausgabewerte an.
Ausgabeknoten Immer 0.

PARENT_UNIQUE_NAME
Der eindeutige Name des übergeordneten Knotens. NULL wird für alle Knoten auf der Stammebene zurückgegeben.

Weitere Informationen dazu, wie die Namen und IDs strukturelle Informationen zum Modell bereitstellen, finden Sie im Abschnitt "Verwenden von Knotennamen und IDs".

KNOTEN_BESCHREIBUNG
Eine benutzerfreundliche Beschreibung des Knotens.

Node Content
Modellstamm Leerzeichen
Marginalstatistik Leerzeichen
Eingabeebene Leerzeichen
Eingabeknoten Eingabeattribut-Name
Verborgene Schicht Leerzeichen
Ausgabeebene Leerzeichen
Ausgabeknoten Wenn das Ausgabeattribut fortlaufend ist, enthält es den Namen des Ausgabeattributs.

Wenn das Ausgabeattribute diskret oder diskretisiert ist, enthält sie den Namen des Attributs und den Wert.

NODE_RULE
Eine XML-Beschreibung der Regel, die in den Knoten eingebettet ist.

Node Content
Modellstamm Leerzeichen
Marginalstatistik Leerzeichen
Eingabeebene Leerzeichen
Eingabeknoten Ein XML-Fragment, das die gleichen Informationen wie die NODE_DESCRIPTION Spalte enthält.
Verborgene Schicht Leerzeichen
Ausgabeebene Leerzeichen
Ausgabeknoten Ein XML-Fragment, das die gleichen Informationen wie die NODE_DESCRIPTION Spalte enthält.

MARGINAL_RULE
Für logistische Regressionsmodelle immer leer.

NODE_PROBABILITY
Die wahrscheinlichkeit, die diesem Knoten zugeordnet ist. Für logistische Regressionsmodelle immer 0.

marginale Wahrscheinlichkeit
Die Wahrscheinlichkeit, vom übergeordneten Knoten den Knoten zu erreichen. Für logistische Regressionsmodelle immer 0.

KNOTEN_VERTEILUNG
Eine geschachtelte Tabelle, die statistische Informationen für den Knoten enthält. Ausführliche Informationen zum Inhalt dieser Tabelle für jeden Knotentyp finden Sie im Abschnitt "Grundlegendes zur NODE_DISTRIBUTION Tabelle" in "Mining Model Content for Neural Network Models (Analysis Services - Data Mining)".

KNOTEN_UNTERSTÜTZUNG
Für logistische Regressionsmodelle immer 0.

Hinweis

Unterstützungswahrscheinlichkeiten sind immer 0, da die Ausgabe dieses Modelltyps nicht probabilistisch ist. Das einzige, was für den Algorithmus sinnvoll ist, ist die Gewichtung; Daher berechnet der Algorithmus keine Wahrscheinlichkeit, Unterstützung oder Varianz.

Informationen zur Unterstützung in den Schulungsfällen für bestimmte Werte finden Sie im Knoten "Marginal Statistics".

MSOLAP_MODEL_COLUMN

Node Content
Modellstamm Leerzeichen
Marginalstatistik Leerzeichen
Eingabeebene Leerzeichen
Eingabeknoten Name des Eingabeattributes.
Verborgene Schicht Leerzeichen
Ausgabeebene Leerzeichen
Ausgabeknoten Name des Eingabeattributes.

MSOLAP_NODE_SCORE
In logistischen Regressionsmodellen immer 0.

MSOLAP_NODE_SHORT_CAPTION
In logistischen Regressionsmodellen immer leer.

Verwenden von Knotennamen und IDs

Die Benennung der Knoten in einem logistischen Regressionsmodell liefert zusätzliche Informationen zu den Beziehungen zwischen Knoten im Modell. In der folgenden Tabelle sind die Konventionen für die IDs aufgeführt, die Knoten in jeder Ebene zugewiesen sind.

Knotentyp Konvention für Knoten-ID
Modellstamm (1) 00000000000000000.
Knoten "Marginalstatistiken" (24) 10000000000000000
Eingabeebene (18) 30000000000000000
Eingabeknoten (21) Beginnt bei 600000000000000000
Subnetz (17) 20000000000000000
Verborgene Schicht (19) 40000000000000000
Ausgabeebene (20) 50000000000000000
Ausgabeknoten (23) Beginnt bei 80000000000000000

Sie können diese IDs verwenden, um zu bestimmen, wie Ausgabeattribute mit bestimmten Eingabeebenenattributen zusammenhängen, indem Sie die NODE_DISTRIBUTION Tabelle des Ausgabeknotens anzeigen. Jede Zeile in dieser Tabelle enthält eine ID, die auf einen bestimmten Eingabeattributeknoten verweist. Die NODE_DISTRIBUTION Tabelle enthält auch den Koeffizienten für dieses Eingabeausgabepaar.

Siehe auch

Microsoft Logistic Regression Algorithm
Inhalte von Miningmodellen für neuronale Netzwerkmodelle (Analysis Services - Data Mining)
Beispiele für Die Abfrage des Logistischen Regressionsmodells
Technische Referenz zum Microsoft Logistics Regressionsalgorithmus