Microsoft Purview Information Protection analizador de informes personalizados (versión preliminar)

En este artículo se describe la característica de informes personalizados del escáner de Microsoft Purview Information Protection (versión preliminar). Custom Reporting proporciona a los administradores del analizador los datos que necesitan en la base de datos del clúster del analizador para crear sus propios informes con los resultados del examen, incluidos el etiquetado, el estado de protección y los tipos de información confidencial (SIT) coincidentes.

Informes personalizados está disponible con Microsoft Purview Information Protection cliente y escáner versión 3.2.89.0 o posterior. Un administrador habilita la creación de informes personalizados mediante el control de características del escáner.

Qué habilita la creación de informes personalizados

Sin informes personalizados, el analizador genera informes CSV y TXT por examen y almacena un conjunto limitado de datos operativos en la base de datos del clúster. Para crear una imagen completa del estado del archivo (qué ha cambiado, qué se etiqueta, qué está protegido y qué tipos de datos confidenciales existen), los administradores tienen que combinar varias exportaciones CSV entre ciclos de examen y cargarlas en una herramienta de informes independiente.

Informes personalizados mueve los datos de estado de archivo y SIT-match a la base de datos del clúster del analizador para que los administradores puedan:

Consulte los recuentos de etiqueta, estado de protección y SIT presentes y anteriores para cada archivo examinado en un repositorio.
Diferencias de proceso entre exámenes (por ejemplo, el cambio en el número de SIT coincidentes por archivo).
Vea qué tipos de información confidencial coinciden en qué archivos y cuántas coincidencias por tipo.
Conecte la base de datos del clúster del analizador a una herramienta de informes de su elección (por ejemplo, Power BI, un almacén de informes empresarial o una herramienta de paneles basada en SQL) sin tener que unir primero las exportaciones CSV.

El escáner sigue siendo la fuente de la verdad. Informes personalizados escribe los datos de informes adicionales en la base de datos del clúster del analizador en el siguiente ciclo de examen después de habilitar la característica.

Esquema de base de datos

Las tablas y columnas de informes que requiere Custom Reporting se agregaron primero al esquema de base de datos del clúster del analizador en la versión de cliente 3.2.57.0. Hasta que informes personalizados estén habilitados, las nuevas columnas y tablas existen, pero no se rellenan. La funcionalidad del escáner existente no cambia.

Nota:

No es necesario instalar primero la versión 3.2.57.0 del cliente. Tanto si va a instalar el escáner como si está actualizando desde cualquier versión anterior, el analizador implementa el esquema completo de la base de datos (incluidas las tablas y columnas de informes personalizados) al instalar o actualizar.

Cuando informes personalizados se habilitan mediante el control de características Escáner, el escáner comienza a rellenar los siguientes datos en el siguiente ciclo de examen.

Adiciones a `dbo.ScannerFiles`

dbo.ScannerFiles sigue conteniendo una fila por archivo examinado. Informes personalizados rellena las siguientes columnas adicionales para capturar el estado del archivo y la diferencia entre el examen actual y el anterior:

Column	Tipo	Descripción
`LabelName`	`NVARCHAR(MAX)`, que admite valores NULL	Nombre de etiqueta actual aplicado al archivo. `NULL` si no está etiquetado.
`PrevLabelId`	`NVARCHAR(MAX)`, que admite valores NULL	Identificador de etiqueta aplicado en el examen anterior, almacenado como una cadena. `NULL` si anteriormente no se etiquetaba.
`PrevLabelName`	`NVARCHAR(MAX)`, que admite valores NULL	Nombre de etiqueta aplicado en el examen anterior. `NULL` si anteriormente no se etiquetaba.
`ProtectionState`	`NVARCHAR(MAX)`, que admite valores NULL	Estado de protección actual del archivo al final del examen.
`PrevProtectionState`	`NVARCHAR(MAX)`, que admite valores NULL	Estado de protección registrado en el examen anterior.
`ClassificationCount`	`INT`, valor predeterminado `0`	El recuento de tipos de información confidencial coincide en el archivo en el examen actual.
`LatestScanSessionId`	`UNIQUEIDENTIFIER`, que admite valores NULL	Identifica la sesión de examen más reciente que tocó el archivo. Se usa para calcular diferencias entre ciclos de examen.
`FileStatus`	`NVARCHAR(MAX)`, que admite valores NULL	Eliminación final del archivo en el ciclo de examen (por ejemplo, el estado requires-justification establecido por `ProcessJob`o `Failed` para los archivos que no se pudieron procesar).

Nueva tabla: `dbo.MatchedClassificationAction`

dbo.MatchedClassificationAction es una nueva tabla que almacena los tipos de información confidencial coincidentes por archivo por examen. Cada fila representa una SIT coincidente para un único archivo en una sola sesión de examen.

Column	Tipo	Descripción
`Id`	`BIGINT IDENTITY` (clave principal)	Clave suplente de la fila.
`FilePath`	`NVARCHAR(MAX)`, que admite valores NULL	Ruta de acceso completa del archivo en el que coincidió sit.
`FileHashPath`	`BINARY(64)`, que admite valores NULL	Hash de la ruta de acceso del archivo. Se une a `dbo.ScannerFiles.HashPath` y se indexa para el rendimiento de la combinación.
`ScanSessionId`	`UNIQUEIDENTIFIER`, que admite valores NULL	Identifica la sesión de examen en la que coincidió la SIT. Se une a `dbo.ScannerFiles.ScanSessionId` y se indexa.
`MatchedInformationTypeName`	`NVARCHAR(MAX)`, que admite valores NULL	Nombre para mostrar del tipo de información confidencial coincidente (por ejemplo, `U.S. social security number (SSN)`).
`MatchedInformationTypeId`	`UNIQUEIDENTIFIER`, que admite valores NULL	GUID de la SIT coincidente. El mismo GUID se usa en los registros de Microsoft Purview Information Protection locales para `Workload=OnPremisesFileShareScanner`.
`MatchedInformationTypeCount`	`INT`, valor predeterminado `0`	Número de coincidencias para esta SIT en el archivo.
`ConfidenceScore`	`INT`, valor predeterminado `0`	Puntuación de confianza de la coincidencia.

Nueva tabla: `dbo.ScannedFilesArchive`

dbo.ScannedFilesArchive es una nueva tabla que almacena un archivo histórico de archivos procesados por el escáner, con filas vinculadas a la sesión de examen que los creó. A diferencia de la tabla dinámica dbo.ScannerFiles , que solo mantiene el estado más reciente de cada archivo, esta tabla conserva los estados archivados anteriores para el seguimiento de cambios, los informes y la auditoría.

Files que el analizador omite porque no ha cambiado nada desde la sesión de examen anterior no se vuelven a insertar, por lo que las sesiones de examen posteriores no contienen una instantánea completa de todos los archivos. En su lugar, solo queda la entrada de archivo existente de la sesión que procesó por última vez el archivo, lo que mantiene el archivo magro al tiempo que conserva un historial de cambios significativos.

Column	Tipo	Descripción
`Id`	`BIGINT IDENTITY` (clave principal)	Clave suplente de la fila.
`HashPath`	`BINARY(64)`	Hash de la ruta de acceso del archivo. Se une a `dbo.ScannerFiles.HashPath`.
`FullPath`	`NVARCHAR(MAX)`	Ruta de acceso completa del archivo en el momento de la sesión de examen.
`ScanSessionId`	`UNIQUEIDENTIFIER`	La sesión de examen que generó esta fila de archivo.
`LastModifiedTime`	`DATETIME2`, que admite valores NULL	Marca de tiempo de última modificación del archivo como se observó durante la sesión de examen.
`LabelId`	`UNIQUEIDENTIFIER`, que admite valores NULL	Identificador de etiqueta aplicado al archivo en el momento de la sesión de examen.
`IssueCount`	`INT`, valor predeterminado `0`	Número de problemas registrados en el archivo en esta sesión de examen.
`EndScan`	`DATETIME2`, que admite valores NULL	Hora en que el archivo completó el procesamiento en esta sesión de examen.
`JobStartTime`	`DATETIME2`, que admite valores NULL	Hora de inicio del trabajo de procesamiento de este archivo.
`LabelName`	`NVARCHAR(MAX)`, que admite valores NULL	Nombre de etiqueta aplicado en el momento de esta sesión de examen.
`PrevLabelId`	`NVARCHAR(MAX)`, que admite valores NULL	Identificador de etiqueta en la sesión de examen anterior, almacenada como una cadena.
`PrevLabelName`	`NVARCHAR(MAX)`, que admite valores NULL	Nombre de la etiqueta en la sesión de examen anterior.
`ProtectionState`	`NVARCHAR(MAX)`, que admite valores NULL	Estado de protección en el momento de esta sesión de examen.
`PrevProtectionState`	`NVARCHAR(MAX)`, que admite valores NULL	Estado de protección en la sesión de examen anterior.
`ClassificationCount`	`INT`, valor predeterminado `0`, que acepta valores NULL	Recuento de coincidencias de tipos de información confidencial en esta sesión de examen.
`LatestScanSessionId`	`UNIQUEIDENTIFIER`, que admite valores NULL	Se sabe que la última sesión de examen tocó el archivo en el momento en que se registró esta fila de archivo.
`FileStatus`	`NVARCHAR(MAX)`, que admite valores NULL	Eliminación del archivo en la sesión de examen (por ejemplo, `Modified` o `Deleted`).

dbo.ScanSummary (totales por examen) no cambia.

Preguntas de ejemplo que los informes personalizados pueden responder

Una vez que informes personalizados rellenan la base de datos, los administradores pueden ejecutar consultas como:

¿Qué repositorios tienen la mayor concentración de SIT coincidentes y cómo ha cambiado esa concentración desde el último examen?
¿Qué archivos se etiquetaron o se etiquetaron de nuevo durante el ciclo de examen más reciente y cuál era la etiqueta anterior?
¿Qué archivos siguen sin etiquetar pero contienen coincidencias para uno o más tipos de información confidencial?
¿Qué tipos de información confidencial son más frecuentes en un repositorio determinado y en qué confianza?
¿Qué archivos pasaron de desprotegidos a protegidos (o lo contrario) desde el último examen?

Habilitación de informes personalizados

Informes personalizados está activado mediante la configuración de características controlada por el administrador. Desde cualquier nodo del clúster del analizador, ejecute:

Set-ScannerConfiguration -FeatureSettings @{CustomReporting=$true}

Para habilitar informes personalizados en el momento de la instalación en un nuevo nodo de escáner, use el -FeatureSettings parámetro con Install-Scanner:

Install-Scanner -SqlServerInstance SQLSERVER1 -Cluster Europe -FeatureSettings @{CustomReporting=$true}

Para confirmar el estado actual, ejecute:

Get-ScannerConfiguration

El cambio surte efecto en todos los nodos del clúster en el siguiente ciclo de examen. No es necesario reiniciar el servicio.

Para dejar de rellenar las columnas y la tabla de informes personalizados, ejecute:

Set-ScannerConfiguration -FeatureSettings @{CustomReporting=$false}

Al deshabilitar informes personalizados, se detienen las nuevas escrituras. Los datos ya escritos en las columnas y tablas de informes no se eliminan, por lo que la característica se puede volver a habilitar más adelante sin pérdida de datos.

Planeamiento de la base de datos del clúster del analizador para la generación de informes

Al activar informes personalizados, la base de datos del clúster del analizador almacena significativamente más datos:

Columnas adicionales por archivo en dbo.ScannerFiles
Una fila por SIT coincidente por archivo por examen en dbo.MatchedClassificationAction
Archivo filas en dbo.ScannedFilesArchive para los archivos que el analizador procesa y archiva durante una sesión de examen (no para cada archivo sin cambios en cada ciclo)

La creación de informes en la base de datos del clúster del analizador también agrega una carga de trabajo de lectura que se ejecuta junto con las lecturas y escrituras operativas del analizador.

Antes de habilitar informes personalizados en producción, tenga en cuenta lo siguiente:

Tamaño del clúster y volumen de examen. Calcule el número de archivos examinados por ciclo, el número típico de coincidencias SIT por archivo y la frecuencia con la que se examina. Use esos números para ajustar el tamaño de la base de datos.
Impacto operativo. La generación de informes de consultas en la misma base de datos en la que está escribiendo el analizador puede competir con el analizador en busca de recursos durante un ciclo de examen.
La carga de trabajo de informes que realmente desea. Los paneles interactivos, los extractos programados y las consultas ad hoc tienen impactos muy diferentes.

Para la mayoría de las implementaciones de producción, se recomienda hospedar la base de datos del clúster del analizador en SQL Server Enterprise para que pueda dedicar una réplica de solo lectura a los informes. Con un grupo de disponibilidad de SQL Server Always On, puede enrutar el tráfico de informes a una réplica secundaria legible. A continuación, las consultas de informes se ejecutan en la réplica secundaria en lugar de competir con la carga de trabajo operativa del analizador en la réplica principal.

Esta separación permite que las herramientas de informes (por ejemplo, Power BI) se conecten a la réplica de solo lectura y se actualicen en su propia cadencia sin afectar al rendimiento del examen en la principal.

Nota:

El propio analizador siempre lee y escribe en la base de datos principal. Solo la carga de trabajo de informes personalizada debe apuntarse a una réplica de solo lectura.

Limitaciones durante la versión preliminar

Los informes personalizados no incluyen un panel integrado en esta versión preliminar. Los clientes crean sus propios informes en la base de datos del clúster del analizador.
La configuración configurada por la configuración de características controlada por el administrador no se sincroniza con el portal de Microsoft Purview. No todas las características del escáner terminarán siendo configurables desde el portal. Para las características que también se pueden configurar desde el portal de Microsoft Purview, una configuración configurada en el portal tiene prioridad e impide las actualizaciones de PowerShell.

Comentarios

¿Le ha resultado útil esta página?

Last updated on 2026-05-05