7.3 KiB
Bloque 4 Tema 2. Administración de bases de datos. Sistemas de almacenamiento y su virtualización. Backup y recuperación. Virtualización de sistemas y de puestos de usuario.
En este tema se estudian los conceptos clave relacionados con la gestión de bases de datos, los sistemas de almacenamiento, las copias de seguridad y la virtualización. Es un tema muy importante en el examen, especialmente en lo relativo a almacenamiento RAID, backup y virtualización.
1. Administración de bases de datos
La administración de bases de datos consiste en gestionar, mantener y asegurar el correcto funcionamiento de un sistema gestor de bases de datos, conocido como SGBD.
Un SGBD es el software que permite crear, gestionar y consultar bases de datos. Ejemplos conocidos son MySQL, Oracle y SQL Server.
Las definiciones clave que hay que conocer son las siguientes. Una base de datos es un conjunto organizado de datos relacionados. Una tabla es la estructura donde se almacenan los datos. Un registro es cada fila de una tabla, y un campo es cada columna. Un índice es una estructura que mejora la velocidad de búsqueda, y una consulta es la operación para recuperar datos.
Las funciones del administrador de bases de datos, el DBA, incluyen la instalación y configuración del SGBD, la gestión de usuarios y permisos, la optimización del rendimiento, la realización de copias de seguridad, la recuperación ante fallos y la monitorización del sistema.
En resumen: el DBA se encarga de que la base de datos funcione correctamente, sea segura y tenga buen rendimiento.
2. Sistemas de almacenamiento
El almacenamiento es el soporte físico o lógico donde se guardan los datos. Se clasifica en tres niveles: almacenamiento primario, que corresponde a la memoria RAM; almacenamiento secundario, formado por discos duros HDD y SSD; y almacenamiento terciario, que incluye cintas y sistemas de archivo externo.
En cuanto a las tecnologías de almacenamiento en red, las más importantes son tres. El DAS, o Direct Attached Storage, es el almacenamiento conectado directamente al equipo. El NAS, o Network Attached Storage, es el almacenamiento conectado a la red. El SAN, o Storage Area Network, es una red dedicada de almacenamiento de alto rendimiento.
En resumen: el almacenamiento puede ser local o en red. NAS y SAN son muy importantes en entornos empresariales.
3. RAID: Redundant Array of Independent Disks
El RAID es un sistema que combina varios discos duros para mejorar el rendimiento, la redundancia o ambos. Es uno de los puntos más preguntados en el examen.
Sus objetivos son aumentar la disponibilidad de los datos, mejorar el rendimiento y proteger frente a fallos de disco.
Los niveles de RAID más importantes son los siguientes.
RAID 0, también llamado striping, distribuye los datos entre varios discos. Su ventaja es el alto rendimiento, pero no tiene tolerancia a fallos: si falla un disco, se pierde todo.
RAID 1, o mirroring, duplica la información en dos discos. Su ventaja es la alta seguridad, aunque la capacidad útil se reduce a la mitad.
RAID 5 utiliza paridad distribuida. Distribuye datos y paridad entre varios discos, con un equilibrio entre rendimiento y seguridad, y soporta el fallo de un disco. Requiere mínimo tres discos.
RAID 6 es similar al RAID 5 pero con doble paridad, lo que permite soportar el fallo de dos discos simultáneamente. Requiere mínimo cuatro discos.
RAID 10, también escrito como RAID uno más cero, es una combinación de RAID 1 y RAID 0, ofreciendo alta seguridad y alto rendimiento. Necesita mínimo cuatro discos.
En resumen: RAID combina discos para mejorar rendimiento o seguridad. RAID 0 no protege datos, RAID 1 duplica, RAID 5 y 6 usan paridad, RAID 10 combina ambos.
4. Virtualización del almacenamiento
La virtualización del almacenamiento consiste en abstraer los recursos físicos para gestionarlos como si fueran un único sistema lógico. Sus ventajas son el mejor aprovechamiento del hardware, mayor flexibilidad, facilidad de gestión y escalabilidad. Ejemplos típicos son los volúmenes lógicos y las cabinas de almacenamiento virtualizadas.
5. Backup y recuperación
El backup es la copia de seguridad de los datos para poder recuperarlos en caso de fallo.
Existen tres tipos principales. El backup completo realiza una copia total de todos los datos. Es el más lento de realizar pero el más rápido de restaurar. El backup incremental copia solo los cambios producidos desde el último backup, sea completo o incremental. Es el más rápido de realizar pero el más lento de restaurar. El backup diferencial copia los cambios desde el último backup completo. Tiene una velocidad de copia y restauración intermedia entre los dos anteriores.
Las políticas de backup deben contemplar la frecuencia de las copias, la retención de datos, la ubicación de las copias, que puede ser local, remota o en la nube, y la verificación periódica de que las copias son correctas.
La regla tres dos uno es fundamental: se deben mantener tres copias de los datos, en dos soportes diferentes, y con una copia fuera del sitio principal.
6. Backup en sistemas físicos y virtuales
El backup en sistemas físicos se realiza sobre servidores o equipos reales mediante software de backup tradicional.
El backup en sistemas virtuales se realiza sobre máquinas virtuales y ofrece funcionalidades adicionales muy útiles como los snapshots o instantáneas del estado del sistema, el clonado de máquinas virtuales completas y la recuperación rápida del sistema.
7. Virtualización de sistemas
La virtualización permite ejecutar varios sistemas operativos en un mismo hardware.
Las definiciones clave son las siguientes. Una máquina virtual es un sistema operativo virtual que se ejecuta sobre el hardware real. Un hipervisor es el software que gestiona las máquinas virtuales.
Existen dos tipos de hipervisor. El hipervisor de tipo 1, también llamado bare metal, se ejecuta directamente sobre el hardware sin sistema operativo base. El hipervisor de tipo 2 se ejecuta sobre un sistema operativo existente.
Las ventajas de la virtualización son el ahorro de costes, el mejor uso de los recursos de hardware, el aislamiento entre sistemas y la facilidad de gestión.
8. Virtualización de puestos de usuario
La virtualización de puestos de usuario, conocida como VDI o Virtual Desktop Infrastructure, consiste en ejecutar escritorios virtuales en servidores centralizados, a los que los usuarios acceden de forma remota.
Sus principales características son el acceso remoto desde cualquier dispositivo, la centralización de la gestión y el mantenimiento, y una mayor seguridad al tener los datos en el centro de datos y no en el dispositivo del usuario.
Miniresumen final del tema
El DBA gestiona las bases de datos y garantiza su correcto funcionamiento. El almacenamiento puede ser DAS, NAS o SAN según cómo esté conectado. El RAID combina discos para mejorar rendimiento o seguridad, siendo RAID 0 sin tolerancia a fallos, RAID 1 con espejo, RAID 5 con paridad simple, RAID 6 con paridad doble y RAID 10 una combinación de espejo y striping. El backup protege la información mediante copias completas, incrementales o diferenciales, y la regla tres dos uno es clave. La virtualización permite ejecutar múltiples sistemas y escritorios en un mismo hardware físico.