Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Lakebase se basa en un conjunto de características que permiten desarrollar, probar y escalar las aplicaciones de base de datos de forma eficaz. En esta sección se presentan los conceptos básicos que diferencian Lakebase de los sistemas de base de datos tradicionales.
Proyectos
Un proyecto de Lakebase es el contenedor de nivel superior para todos los recursos de la base de datos. Cada proyecto pertenece a un área de trabajo de Azure Databricks y contiene una o varias ramas, cada una con su propio proceso y bases de datos.
Project
└── Branch (e.g., production)
├── Compute (read-write)
└── Database (e.g., databricks_postgres)
Más información: Proyectos | administrar proyectos
Autoscaling
Lakebase ajusta automáticamente los recursos de proceso en función de las demandas de carga de trabajo. A medida que el tráfico de la aplicación aumenta o disminuye, los recursos de proceso se escalan o reducen verticalmente dentro del intervalo configurado sin intervención manual ni tiempo de inactividad.
Ventajas clave:
- Ajuste automático: Los recursos se escalan en función de la demanda real.
- Sin tiempo de inactividad: El escalado dentro del intervalo configurado se produce sin interrumpir las conexiones. Sin embargo, cambiar la configuración de CU mínima o máxima podría provocar una breve interrupción.
- Optimización de costos: Pague solo por los recursos que realmente use.
- Coherencia del rendimiento: Mantenga el rendimiento con capacidad de respuesta durante los picos de tráfico.
Más información: Escaladoautomático Configuración del | escalado automático
Escalado automático a cero
Cuando la base de datos está inactiva, Lakebase puede escalar automáticamente los recursos de proceso a cero, lo que elimina los costos de la capacidad sin usar. Cuando se reanuda la actividad, los recursos de computación se escalan automáticamente hacia arriba en cuestión de segundos.
Ventajas clave:
- Costos por inactividad cero: No se cobran cargos de cómputo cuando la base de datos está inactiva.
- Reanudación instantánea: Las bases de datos se reactivan automáticamente cuando se accede a ellas.
- Compatible con el desarrollo: Ideal para entornos de desarrollo y ensayo con uso intermitente.
- Administración automática: No se requiere intervención manual.
Más información: Escalar a cero | Configurar escalar a cero
Ramas de base de datos
Las ramas de base de datos de Lakebase funcionan de forma similar a las ramas de Git para el código. Puede crear ramas instantáneas aisladas para el desarrollo, las pruebas o la experimentación sin duplicar datos ni afectar al entorno de producción.
Ventajas clave:
- Creación instantánea: Las ramas se crean en tan solo segundos mediante la tecnología de copia en escritura.
- Eficiente en costos: Solo los datos modificados se almacenan por separado, lo que minimiza los costos de almacenamiento.
- Entornos aislados: Pruebe los cambios de forma segura sin afectar a la base de datos principal.
- Colaboración: Los miembros del equipo pueden trabajar en ramas independientes simultáneamente.
Más información: Ramas de base de datos | Administrar ramas
Procesos y puntos de conexión
Un punto de conexión de Lakebase es el punto de conexión estable que usa la aplicación para llegar a una base de datos. Detrás de cada punto de conexión, una o varias instancias de proceso controlan el procesamiento de consultas. La cadena de conexión sigue siendo la misma incluso al escalar los recursos de proceso o añadir alta disponibilidad.
Normalmente, una rama suele tener un extremo de lectura y escritura (su recurso de cómputo principal) y, opcionalmente, uno o varios extremos de solo lectura (réplicas de lectura).
Más información: Procesamiento y puntos de conexión | Administrar el procesamiento
Arquitectura de almacenamiento
Lakebase almacena los datos en una capa de almacenamiento distribuida que es independiente del proceso. El almacenamiento tiene redundancia de zona y persiste independientemente del estado del proceso de cómputo, tanto si este se está ejecutando como si está en pausa o realizando una conmutación por error. Esta separación del almacenamiento permite ramificaciones instantáneas, réplicas de lectura y escalado hasta cero sin duplicación de datos.
Ventajas clave:
- Almacenamiento de alta disponibilidad: Azure Databricks mantiene un almacenamiento de alta disponibilidad independientemente de la configuración de cómputo de alta disponibilidad.
- Persiste pese a los cambios de cómputo: El almacenamiento sigue estando disponible durante fallos de cómputo, pausas o cambios de configuración.
- Base para ramas y réplicas: La creación de ramas instantáneas y las réplicas de lectura se basan en varias instancias de proceso que comparten la misma capa de almacenamiento.
Más información: Arquitectura de almacenamiento
Alta disponibilidad
Pares de alta disponibilidad combinan una instancia de cálculo primaria de lectura/escritura con una o varias instancias de cálculo secundarias distribuidas en varias zonas de disponibilidad. Cuando la principal deja de estar disponible, Lakebase promueve automáticamente una secundaria y tu aplicación continúa desde la última transacción confirmada. La cadena de conexión permanece sin cambios en todo momento. El almacenamiento ya está altamente disponible. Al habilitar la alta disponibilidad, se añade redundancia a nivel de cómputo para la conmutación automática por fallo.
Ventajas clave:
- Conmutación por error automática: Lakebase promueve una instancia de cómputo secundaria sin intervención manual.
- Sin pérdida de datos: La conmutación por error conserva todas las transacciones confirmadas.
- Cadenas de conexión estables: La aplicación no necesita cambiar su configuración de conexión después de una conmutación por error.
Más información: Alta disponibilidad | Administrar la alta disponibilidad
Réplicas de lectura
Las réplicas de lectura son procesos independientes de solo lectura que realizan operaciones de lectura en los mismos datos que el proceso de lectura y escritura principal. A diferencia de las réplicas tradicionales, las réplicas de lectura de Lakebase no duplican los datos, leen desde la misma capa de almacenamiento, lo que permite la creación instantánea y elimina los costos de almacenamiento adicionales.
Ventajas clave:
- Escalado horizontal: Distribuir solicitudes de lectura entre varias réplicas.
- Sin duplicación de datos: Todas las réplicas leen desde el mismo almacenamiento.
- Creación instantánea: Disponible en segundos sin copiar datos.
- Eficiente en costos: No hay costos de almacenamiento adicionales, además de soporte para escalado automático y escalado a cero.
Más información: Réplicas de lectura | Administrar réplicas de lectura
Cómo funcionan juntos
Estos conceptos básicos funcionan juntos para crear una plataforma de base de datos eficaz y flexible:
- Los proyectos organizan todos los recursos de la base de datos y pertenecen a un área de trabajo de Azure Databricks.
- El escalado automático garantiza que cada rama tenga la cantidad correcta de proceso en función de la demanda.
- El escalado a cero reduce los costes de las ramas inactivas al suspender los recursos de computación cuando no se utilizan.
- Las ramas de base de datos permiten crear entornos aislados para el desarrollo y las pruebas sin duplicar los datos.
- Los recursos de computación y los endpoints proporcionan puntos de conexión estables a medida que escalas o reconfiguras tu infraestructura.
- La arquitectura de almacenamiento mantiene la redundancia de zona de datos y la alta disponibilidad, independientemente del estado de proceso.
- La alta disponibilidad añade redundancia a nivel de proceso y conmutación automática por error entre zonas de disponibilidad para cargas de trabajo de producción.
- Las réplicas de lectura distribuyen el tráfico de lectura entre instancias de proceso adicionales.
Esta arquitectura le permite crear y escalar aplicaciones de base de datos con mayor flexibilidad, menores costos y menos sobrecarga operativa que los sistemas de base de datos tradicionales.