通过


更改挖掘模型中某列的离散化处理

适用于: SQL Server 2019 及更早版本的 Analysis Services Azure Analysis Services Fabric/Power BI Premium

重要

SQL Server 2017 Analysis Services 中弃用了数据挖掘,现已在 SQL Server 2022 Analysis Services 中停止使用。 文档不会更新为已弃用和已停用的功能。 若要了解详细信息,请参阅 Analysis Services 向后兼容性

SQL Server Analysis Services 会自动离散化值,也就是说,它在某些方案中将数字列中的数据装箱。 例如,如果您的数据包含连续型数值数据,并且您创建了一个决策树模型,那么根据数据的分布,连续数据的每一列将会被自动分箱。 如果要控制数据的离散化方式,则必须更改挖掘结构列的属性,该列控制数据在模型中的使用方式。

有关如何在挖掘模型中设置属性的一般信息,请参阅 挖掘模型列

显示挖掘模型列的属性

  1. 在数据挖掘设计器中的“ 挖掘模型 ”选项卡中,右键单击包含挖掘模型名称的列标题,或网格中包含挖掘算法名称的行,然后选择“ 属性”。

    属性” 窗口显示与整个挖掘模型关联的属性。

  2. 在屏幕左侧附近的 “结构 ”列中,单击包含要离散化的连续数值数据的列。

    属性” 窗口将更改为仅显示与该列关联的属性。

更改离散化方法

  1. “挖掘属性” 窗口中,单击 内容旁边的文本框,然后从下拉列表中选择 “离散化 ”。

    现在已启用属性DiscretizationBucketCountDiscretizationMethod

  2. “属性” 窗口中,单击旁边的 DiscretizationMethod 文本框并选择以下值之一: “自动”、“ EqualAreas”或 “群集”。

    注释

    如果列用法设置为 “忽略”,则列的 “属性” 窗口为空。

    在设计器中选择其他元素时,新值将生效。

  3. “属性” 窗口中,单击旁边的 DiscretizationBucketCount 文本框并键入数值。

    注释

    如果更改这些属性,则必须重新处理结构以及想要使用新设置的任何模型。

另请参阅

数据挖掘模型任务和如何操作