Skip to main content

¿Qué es la redundancia de datos?

La redundancia de datos es una situación que ocurre dentro de los sistemas de bases de datos e implica la creación involuntaria de datos duplicados que no son necesarios para la función de la base de datos. Si bien la redundancia es a menudo un rasgo deseable en algunas situaciones, esto no es cierto cuando se trata de la función de una base de datos. La presencia de datos duplicados a menudo puede tener un efecto adverso en la función del sistema, lo que resulta en la devolución de información en respuesta a consultas del sistema que no es útil. Una de las funciones clave de la gestión de datos es la identificación de datos duplicados y la eliminación de esas duplicaciones.

El potencial de redundancia de datos se encuentra en casi cualquier tipo de programa de base de datos. Los programas que se consideran planos, como las hojas de cálculo y que dependen de la entrada manual de datos, son particularmente susceptibles a la duplicación de información que puede generar complicaciones a la hora de recuperar la información deseada. Las bases de datos de estilo relacional, como las bases de datos de contactos de ventas, a menudo incluyen procesos que ayudan a minimizar las posibilidades de duplicación involuntaria, como la creación de dos archivos de contactos diferentes en el mismo contacto asociado con la misma compañía. Incluso con el uso de verificaciones del sistema para ayudar a reducir la incidencia de la redundancia de datos, todavía existe la posibilidad de que ocurran problemas, por lo que es necesario participar periódicamente en la tarea de limpieza de datos dentro de una base de datos.

En el mejor de los casos, la redundancia de datos significa que la base de datos está llena de información que no es esencial pero que no representa una amenaza real para la capacidad de encontrar los datos cuando y según sea necesario. En el peor de los casos, la presencia de datos duplicados ralentiza las funciones esenciales de la base de datos y puede complicar el proceso de usar la base de datos para administrar ciertas tareas. Por ejemplo, el uso de una base de datos de clientes que está obstruida con información redundante para generar etiquetas de correo daría como resultado la creación de una cantidad de niveles duplicados, por lo que es necesario ordenar y eliminar los duplicados antes de que las etiquetas puedan usarse, o tomar el tiempo para limpiar la base de datos antes de intentar generar las etiquetas.

Afortunadamente, el monitoreo y la corrección de la redundancia de datos es algo que muchos sistemas de administración de datos pueden lograr con relativa facilidad. Algunos sistemas marcarán la entrada de datos duplicados, lo que facilitará la revisión de la duplicación percibida y decidirá si eliminarla o dejarla en reposo. Incluso hay programas de software que se pueden usar para escanear una base de datos existente en busca de duplicaciones y eliminar automáticamente esas entradas redundantes con relativa facilidad.