martes, 8 de febrero de 2011

Arquitectura de Datos - Modelado de Datos

Modelado de datos
Un modelo es un conjunto de herramientas conceptuales que permite describir la estructura de los datos (tipos de datos y forma en la que se relacionan) y sus restricciones de integridad. El modelado hace la pregunta ¿Qué?.
También se puede decir que un modelo de datos permite describir los elementos de la realidad que intervienen en un cierto problema y la forma en la que éstos se relacionan entre sí.
Los modelos de datos se pueden clasificar en 3 tipos:
1. Modelos conceptuales: También llamados modelos de datos semánticos. Están orientados a dar una visión general del negocio, representando los elementos que intervienen en el problema a resolver y sus relaciones. Se basan en objetos.
o Modelo Entidad Relación
2. Modelos lógicos: También llamados modelos de datos clásicos. En estos modelos se incluyen todos los detalles de los datos. Se basan en registros.
o Modelo Relacional, modelo de redes, modelo jerárquico
3. Modelos físicos: También llamados modelos de datos primitivos. Son un esquema de datos de bajo nivel que se implementa dentro del manejador de base datos.
o Administración de ficheros (p.ej. CA-DATACOMB de Computer Associates International)
Para diseñar una base de datos se deben usar primero los modelos conceptuales para lograr una descripción de alto nivel de la realidad, y luego se transforma el esquema conceptual en un esquema lógico.
Los modelos conceptuales, para poder representar correctamente la realidad, deben poseer las siguientes cualidades:
* Expresividad: Deben tener suficientes conceptos para expresar perfectamente la realidad.
* Simplicidad: Deben ser simples para que los esquemas sean fáciles de entender.
*  Minimalidad: Cada concepto debe tener un significado distinto.
*  Formalidad: Todos los conceptos deben tener una interpretación única, precisa y bien definida.
El resultado de un modelado de datos es una representación que tiene dos componentes:
1) Las propiedades estáticas: Que se definen en un esquema.
* Objeto: Cualquier entidad con existencia independiente sobre el que almacenan datos. Puede ser simple o compuesto.
* Relación: Asociación entre objetos.
* Restricción estática: Propiedad estática del mundo real que no puede expresarse con los anteriores, ya que sólo se da en la base de datos; suele corresponder a valores u ocurrencias, y puede ser sobre atributos, entidades y relaciones.
* Objeto compuesto: definidos como nuevos objetos dentro de la base de datos, tomando como punto de partida otros existentes, mediante mecanismos de agregación y asociación.
* Generalización: se trata de relaciones de subclase entre objetos, es decir, parte de las características de diferentes entidades pueden resultar comunes entre ellas.
2) Las propiedades dinámicas: Que se definen como especificaciones de transacciones, consultas e informes.
* Operación: Acción básica sobre objetos o relaciones (crear, modificar, eliminar...).
* Transacción: Conjunto de operaciones que deben ejecutarse en su conjunto obligatoriamente.
* Restricción dinámica: Propiedades del mundo real que restringen la evolución en el tiempo de la base de datos. 1
Proceso de Modelado de Datos.
El modelado de datos es uno de los elementos más importantes a la hora de iniciar el desarrollo de cualquier proyecto. Esta es la estructura, sobre la que realmente reside la verdadera esencia de la aplicación. Incluso determina si el proyecto va a cumplir con su verdadero objetivo. Esta fase es crítica en el diseño de la arquitectura de software, y soporta directamente la implementación de los requerimientos aplicativos en esta arquitectura. Esta actividad es independiente de la implementación del manejador de base de datos a utilizar y las herramientas para explotarlo. Existen algunas metodologías informales que indican cómo realizar este modelado, en general serian las siguientes:
* Identificar requerimientos generales de la arquitectura de datos. Validar los requerimientos generales de la arquitectura de datos (desempeño, concurrencia, integridad, seguridad, etc.)
* Análisis de Fuentes de Información Actuales. Estas fuentes incluyen la documentación en papel o digital que ya exista (archivos, reportes, formatos, recibos, listados, etc.).
* Identificación de Entidades Principales. En esta fase se enlistan los campos identificados y se asignan a sus correspondientes entidades. También se identifican los campos llave.
* Elaborar diagrama E-R preliminar. Se identifican las relaciones entre entidades.
* Verificar Modelo E-R. Se cargan algunos datos de prueba, y se normalizan las tablas. Y se actualiza el modelo E-R.
* Implementar el Modelo E-R final. Se implementa en el manejador específico el Modelo E-R final.
El modelado de datos debe verificarse para asegurarse de que cumpla los requerimientos específicos de calidad de la arquitectura de datos. A continuación se enumeran los factores generales que deben ser validados sobre el modelado:
* Información incorrecta. Anomalía de modificación: Si la información es repetida en más de un lugar en la base de datos, es común que sea inconsistente (sensible a mayúsculas, abreviaciones, captura incorrecta, etc.)
* Inhabilidad para ingresar información necesaria. Anomalía de inserción: Si no se cuenta con los campos y relaciones correctas, no va a ser posible ingresar datos que el negocio necesita (orden de la inserción de información).
* Perdida de información necesaria. Anomalía de eliminación: Cuando se elimina información en base de datos mal diseñados, comúnmente también se elimina información necesaria.
* Dificultad para implementar cambios. Una base de datos correctamente diseñada permite el crecimiento y cambios de su información.

No hay comentarios:

Publicar un comentario