Skip to main content

¿Qué son las herramientas de minería de datos?

Las herramientas de minería de datos son componentes y teorías de software que permiten a los usuarios extraer información de los datos. Las herramientas brindan a individuos y empresas la capacidad de recopilar grandes cantidades de datos y usarlos para tomar decisiones sobre un usuario o grupos de usuarios en particular. Algunos de los usos más comunes de las herramientas de minería de datos se encuentran en los campos de marketing, protección contra fraudes y vigilancia.

La extracción manual de datos existe desde hace cientos de años. Sin embargo, la automatización de la minería de datos ha sido más frecuente desde los albores de la era de las computadoras. Durante el siglo XX, surgieron varias ciencias de la computación para ayudar a respaldar el concepto de desarrollar herramientas de minería de datos. El objetivo general de la utilización de las herramientas es descubrir patrones ocultos. Por ejemplo, si una compañía de mercadeo descubre que una persona realiza un viaje mensual desde la ciudad de Nueva York a Los Ángeles, es beneficioso para esa compañía anunciar los detalles del destino a la persona.

Dentro de la industria de minería de datos, se han establecido estándares para definir los parámetros del uso de herramientas de minería de datos. Anualmente, el Grupo de Interés Especial de la Association for Computing Machinery sobre Descubrimiento de Conocimiento y Minería de Datos (SIGKDD) celebra una reunión para determinar qué procesos se utilizan. El mismo grupo también es responsable de evaluar las implicaciones éticas del análisis de datos de individuos y empresas. El grupo publica una revista semestral titulada SIGKDD Explorations.

La herramienta más utilizada en la minería de datos es el proceso denominado Knowledge Discovery in Databases (KDD). KDD fue desarrollado en 1989 por Gregory Piatetsky-Shapiro. Con esta herramienta de minería de datos, los usuarios pueden procesar datos sin procesar, extraer los datos para obtener información e interpretar los diversos resultados en forma de gestión de la información.

Una de las formas más importantes de herramientas de minería de datos se utiliza para combatir el terrorismo en el siglo XXI. En los Estados Unidos, el Consejo Nacional de Investigación utiliza los conceptos de minería de patrones y minería de datos basada en temas para identificar la actividad terrorista en la gran cantidad de información en todo el mundo. La minería de patrones se define por el proceso de ubicar patrones dentro de un gran volumen de datos. La minería de datos basada en temas intenta identificar las relaciones entre individuos. Ambas técnicas también pueden utilizarse en la práctica comercial general definiendo la mentalidad de una base de clientes y la relación interactiva entre los clientes.