taiage-spring/src/main/resources/temas/bloque3/tema1_audio.md

5.4 KiB

Bloque 3 Tema 1. Modelado de datos, metodologías y reglas. Entidades, atributos y relaciones. Diseño de bases de datos. Diseño lógico y físico. El modelo lógico relacional. Normalización.

Este tema estudia cómo representar la información de un sistema mediante modelos de datos, el diseño de bases de datos y el proceso de normalización.


1. Modelado de datos

El modelado de datos es el proceso mediante el cual se analiza y representa la información que debe gestionar un sistema de información. Permite definir qué datos existen, cómo se relacionan entre sí y qué reglas deben cumplir.

Sus objetivos son representar la realidad del negocio, facilitar el diseño de bases de datos, reducir redundancias, garantizar la integridad de los datos y facilitar el mantenimiento del sistema.

El modelado se divide en tres niveles. El nivel conceptual representa la realidad del negocio de forma independiente del sistema gestor de base de datos. El nivel lógico adapta el modelo al tipo de base de datos que se va a utilizar, definiendo tablas y relaciones. El nivel físico describe la implementación real, incluyendo la optimización del almacenamiento.


2. El modelo Entidad-Relación

El modelo Entidad-Relación, o modelo E-R, es el más utilizado para el diseño conceptual de bases de datos. Sus elementos fundamentales son entidades, atributos y relaciones.

Una entidad es cualquier objeto del mundo real sobre el que se desea almacenar información. Ejemplos de entidades son Cliente, Producto, Pedido y Empleado. Las entidades se representan con rectángulos en los diagramas E-R.

Existen dos tipos de entidades. La entidad fuerte tiene clave propia y existe por sí misma. La entidad débil no tiene clave propia y depende de una entidad fuerte para existir.

Un atributo es una característica o propiedad de una entidad. El atributo clave identifica unívocamente a cada entidad. El atributo multivaluado puede tener varios valores para la misma entidad. El atributo derivado se calcula a partir de otros, como la edad que se calcula desde la fecha de nacimiento. El atributo compuesto está formado por subatributos, como la dirección formada por calle, ciudad y código postal.

Una relación es una asociación entre dos o más entidades. La cardinalidad define cuántas instancias de una entidad pueden asociarse con instancias de otra. Los tipos son uno a uno o 1:1, uno a muchos o 1:N, y muchos a muchos o N:M.


3. Diseño de bases de datos

El proceso de diseño de bases de datos sigue tres fases.

En el diseño conceptual se crea el modelo E-R que captura la realidad del negocio de forma abstracta, sin depender de ningún sistema gestor.

En el diseño lógico se transforma el modelo conceptual en un esquema de base de datos adaptado al modelo elegido, que en la mayoría de los casos es el modelo relacional. En esta fase se definen las tablas y sus relaciones.

En el diseño físico se optimiza el esquema para su implementación real en un sistema gestor concreto. Se definen los índices, las particiones y las estructuras de almacenamiento.


4. El modelo lógico relacional

El modelo relacional representa los datos en forma de tablas, también llamadas relaciones. Cada tabla tiene filas, llamadas tuplas, y columnas, llamadas atributos.

Los conceptos clave del modelo relacional son los siguientes. La clave primaria es el atributo o conjunto de atributos que identifica unívocamente cada fila de la tabla. La clave foránea o clave externa es un atributo que referencia la clave primaria de otra tabla, estableciendo la integridad referencial entre ellas. La clave alternativa es un atributo que podría ser clave primaria pero no ha sido elegido como tal.

La integridad referencial garantiza que los valores de una clave foránea siempre correspondan a valores existentes en la tabla referenciada.


5. Normalización

La normalización es el proceso de organizar las tablas de una base de datos para eliminar redundancias, evitar anomalías de inserción, actualización y borrado, y mejorar la integridad de los datos.

La normalización se basa en el concepto de dependencia funcional. Se dice que el atributo B depende funcionalmente del atributo A cuando para cada valor de A existe un único valor de B.

Las formas normales principales son cuatro.

La Primera Forma Normal, o 1FN, requiere que todos los atributos de la tabla sean atómicos, es decir, que cada celda contenga un único valor indivisible y no haya grupos repetitivos.

La Segunda Forma Normal, o 2FN, requiere que la tabla esté en 1FN y que todos los atributos no clave dependan completamente de la clave primaria, eliminando las dependencias parciales. Esto solo es relevante cuando la clave primaria es compuesta.

La Tercera Forma Normal, o 3FN, requiere que la tabla esté en 2FN y que no existan dependencias transitivas, es decir, que ningún atributo no clave dependa de otro atributo no clave.

La Forma Normal de Boyce-Codd, o BCNF, es una versión más estricta de la 3FN. Requiere que para toda dependencia funcional no trivial, el determinante sea una superclave.


Miniresumen final del tema

El modelado de datos tiene tres niveles: conceptual, lógico y físico. El modelo E-R usa entidades, atributos y relaciones con cardinalidades 1:1, 1:N y N:M. El modelo relacional organiza los datos en tablas con claves primarias y foráneas. La normalización elimina redundancias mediante las formas normales 1FN, 2FN, 3FN y BCNF.