Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
El escalado a cero suspende automáticamente el proceso de Lakebase después de un período de inactividad, lo que minimiza los costos de las bases de datos que no están activas continuamente. Esta característica es especialmente valiosa para entornos de desarrollo, pruebas y ensayo, así como bases de datos de producción con períodos de inactividad predecibles.
Cuando la escala a cero está habilitada:
- Su entorno de computación se suspende automáticamente después de un periodo de inactividad. El tiempo de espera de inactividad tiene como valor predeterminado 24 horas y se puede establecer entre 60 segundos y 7 días.
- Solo paga por el tiempo de proceso activo, no por períodos de inactividad
- El proceso se reactiva automáticamente en unos cientos de milisegundos al ejecutar una nueva consulta.
En este diagrama se muestra el comportamiento de escalado a cero junto con el escalado automático, que muestra un período inactivo seguido de la suspensión automática hasta que se vuelve a acceder a la base de datos.
El escalado a cero funciona independientemente del escalado automático. El escalado automático ajusta los recursos de proceso durante períodos activos en función de la demanda de cargas de trabajo. La escala a cero suspende el proceso por completo durante la inactividad, lo que reduce los costos de proceso a cero.
Cómo funciona el escalado a cero
Suspensión automática
Cuando el proceso permanece inactivo (sin consultas ni conexiones) durante el período de tiempo de espera configurado, Lakebase lo suspende automáticamente. Durante la suspensión:
- El proceso no consume ningún recurso y no incurre en costos de proceso.
- Los datos permanecen almacenados y disponibles de forma segura
- Las cadenas de conexión y las credenciales siguen siendo válidas
- El punto de conexión de computación permanece accesible, pero inactivo.
Reactivación automática
Cuando una nueva consulta o solicitud de conexión llega a un proceso suspendido, Lakebase la reactiva automáticamente. Proceso de reactivación:
- No requiere intervención manual
- Controla de forma transparente la solicitud de conexión después de activarse
- Restaura el proceso a su tamaño mínimo configurado (si está habilitado el escalado automático)
Las aplicaciones deben implementar lógica de reintento de conexión para controlar el breve período de reactivación correctamente.
Configuración de tiempo de espera
Configure el tiempo de espera de escala a cero para controlar la rapidez con la que se suspende un proceso después de volverse inactivo. Puede establecerlo entre 60 segundos (1 minuto) y 7 días. El tiempo de espera determina el equilibrio entre:
- Tiempos de espera más cortos (en el orden de los minutos): la suspensión más rápida reduce los costos, pero puede provocar reactivaciones más frecuentes para cargas de trabajo intermitentes.
- Tiempos de espera más largos (horas a días): menos reactivaciones mejoran la experiencia del usuario para la actividad esporádica. El tiempo de espera predeterminado de 24 horas es adecuado para la mayoría de las bases de datos de producción. Puede ampliar la ventana hasta el máximo de 7 días cuando desee que el proceso permanezca activo durante los períodos inactivos.
Beneficios de escalar a cero
- Reducción de costos: Al suspender los procesos inactivos, solo se paga por el tiempo de uso real. Una base de datos de desarrollo usada 8 horas al día cuesta un tercio tanto como un proceso siempre activo.
- Implementación flexible: La escala a cero permite la implementación rentable de varios entornos. Puede mantener entornos independientes de desarrollo, prueba, staging y previsualización sin incurrir en costos de cómputo 24/7 para cada uno.
- Sin administración manual: El sistema controla automáticamente la suspensión y la reactivación, lo que elimina la necesidad de iniciar y detener manualmente los procesos en función de los patrones de uso.
- Configuración conservada: Toda la configuración de proceso, los detalles de conexión y las configuraciones de base de datos permanecen intactas durante la suspensión. Cuando el proceso se reactiva, se reanuda con la misma configuración.
Configuración de la escala en cero
El escalado a cero se puede activar o desactivar para cualquier recurso de cómputo. Cuando se activa, se configura el tiempo de espera de inactividad que desencadena la suspensión. El valor predeterminado es 24 horas y el intervalo permitido es de 60 segundos a 7 días.
El tiempo de espera predeterminado de 24 horas funciona bien para la mayoría de las bases de datos, lo que reduce los costos durante períodos de inactividad prolongados y mantiene las reactivaciones poco frecuentes. Si la carga de trabajo requiere disponibilidad continua sin latencia de inicio, desactive la escala a cero para ese proceso. En el caso de las ramas de desarrollo, los tiempos de espera más cortos, como 30 minutos, reducen aún más los costos.
Para obtener instrucciones detalladas sobre cómo configurar la configuración de escalado a cero, consulte Administración de procesos.
Escenarios comunes de escalado a cero
Entornos de desarrollo y pruebas
Las ramas de desarrollo para probar los cambios de esquema, validar canalizaciones de datos o experimentar con nuevas características suelen ver actividad intermitente. El escalado a cero suspende automáticamente estos procesos durante las noches, los fines de semana y entre sesiones de trabajo, lo que reduce significativamente los costos.
Entornos de ensayo y previsualización
Los entornos de ensayo usados para la validación previa a la implementación o los entornos de versión preliminar creados para las solicitudes de incorporación de cambios a menudo permanecen inactivos entre ciclos de prueba. La escala a cero garantiza que estos entornos consumen recursos solo durante períodos de prueba activos.
Agentes y aplicaciones de inteligencia artificial con períodos de inactividad
Los agentes de inteligencia artificial, los bots de chat o las herramientas internas que atienden horas comerciales específicas o tienen patrones de tiempo de inactividad predecibles pueden beneficiarse de la escala a cero. El proceso se suspende durante las horas fuera del horario y se reactiva automáticamente cuando los usuarios vuelven.
Bases de datos de aplicaciones multicliente
Las aplicaciones que sirven a varios clientes pueden usar el escalado a cero para las bases de datos específicas del arrendatario. El procesamiento para los clientes inactivos se suspende automáticamente, lo que reduce los costos de computación agregados en todos los clientes.
Consideraciones importantes
Restablecimiento del contexto de sesión
Cuando una computadora se suspende y se reactiva posteriormente, el contexto de sesión se restablece. Esto incluye:
- Estadísticas en memoria y contenido de caché
- Tablas temporales y declaraciones preparadas
- Opciones de configuración específicas de la sesión
- Grupos de conexiones y transacciones activas
Si la aplicación requiere datos de sesión persistentes, considere la posibilidad de desactivar la escala a cero para mantener la disponibilidad continua del proceso.
Latencia de inicio
El breve período de reactivación (normalmente unos cientos de milisegundos) podría afectar a la experiencia del usuario para la primera consulta después de la suspensión. En el caso de las aplicaciones que requieren tiempos de respuesta inmediatos, puede hacer lo siguiente:
- Desactivar el escalado a cero para los recursos de computación siempre disponibles
- Implementar el calentamiento de conexiones a nivel de aplicación
- Usar períodos de tiempo de espera más largos para reducir la frecuencia de reactivación
Comportamiento de la rama de producción
Al crear un proyecto, la production rama se crea con la escala a cero habilitada de forma predeterminada, con un tiempo de espera de inactividad de 24 horas. Puede ajustar el tiempo de espera o desactivar el escalado a cero para la rama de producción si su carga de trabajo requiere disponibilidad continua.
Escalado a cero y escalado automático
La escala a cero complementa el escalado automático para optimizar tanto el rendimiento como los costos:
- Durante períodos activos: El escalado automático ajusta el tamaño de cómputo en función de la demanda de la carga de trabajo dentro del intervalo configurado, aumentando el escalado durante actividades intensas y descendiendo durante cargas más ligeras.
- Durante períodos inactivos: Después del tiempo de espera de escalado a cero, el proceso suspende completamente y los costos de proceso se reducen a cero independientemente del intervalo de escalado automático configurado.
- Cuando se reactiva: El proceso se reinicia con el tamaño mínimo de escalado automático (si está habilitado el escalado automático) y el escalado automático ajusta los recursos en función de la nueva carga de trabajo.
Esta combinación maximiza la eficacia: el escalado automático optimiza el uso de recursos durante la actividad, mientras que la escala a cero elimina los costos durante la inactividad.
Pasos siguientes
- Configurar los ajustes de escalado a cero: Aprenda a habilitar, ajustar o desactivar el escalado a cero para sus recursos de cómputo. Consulte Escalar a cero.
- Ver métricas de proceso: vea cómo las métricas reflejan los períodos de proceso inactivos y el comportamiento de escala a cero. Consulte panel de métricas.
- Escalado automático: comprenda cómo los procesos ajustan los recursos durante períodos activos. Consulte Escalado automático.
- Ramas de base de datos: cree entornos de base de datos aislados para desarrollo y pruebas. Consulte Ramas.