Compartir a través de


Índices de filtro Bloom (en desuso)

Important

No utilice índices de filtro Bloom. Azure Databricks ha dejado de usar esta característica y recomienda quitar los índices de filtro bloom existentes de las tablas.

Los índices de filtro Bloom son un mecanismo heredado de omisión de datos que Azure Databricks ya no recomienda para ninguna carga de trabajo. Agregan sobrecarga de escritura, son difíciles de ajustar y se sustituyen por alternativas más eficaces.

En su lugar, use las siguientes características:

  • E/S predictiva: en el proceso habilitado para Photon con Databricks Runtime 12.2 y versiones posteriores, la E/S predictiva realiza la omisión de archivos en todas las columnas automáticamente. Reemplaza completamente los índices de filtro Bloom, que solo agregan sobrecarga a la escritura cuando Photon está habilitado.
  • Agrupación en clústeres líquidos: en Databricks Runtime 13.3 y versiones posteriores, la agrupación en clústeres líquidos mejora la omisión de datos mediante la organización de datos en función de las columnas filtradas con frecuencia.

Eliminar los índices de filtros Bloom existentes

Si tiene índices de filtro Bloom existentes en sus tablas, elimínelos para eliminar la sobrecarga de escritura innecesaria.

DROP BLOOMFILTER INDEX ON TABLE table_name

Para obtener más información sobre la sintaxis, consulte DROP BLOOM FILTER INDEX.

Después de quitar todos los índices de filtro bloom, ejecute VACUUM para limpiar los archivos de índice subyacentes en el _delta_index directorio.