Skip to main content

¿Qué es la minería de datos?

La minería de flujo de datos es una estrategia que implica identificar y extraer información de un flujo de datos activo. Con este enfoque, la idea es extraer los datos sin crear ningún tipo de interrupción en la secuencia en sí, lo que hace posible que otros también utilicen los datos incluso mientras se realiza la extracción. Este tipo de esfuerzo de minería de flujo de datos puede involucrar todo tipo de datos, desde transmisión de voz a video a través de Internet e incluso tareas cotidianas como retirar dinero de una cuenta bancaria utilizando un cajero automático o manteniendo una conversación telefónica.

Una de las características de la minería de flujo de datos es la capacidad de proyectar o predecir con precisión cómo ubicar la información deseada y qué tipo de herramientas de descubrimiento de conocimiento ayudarán a localizar y extraer con éxito la información deseada. Por ejemplo, cuando un cliente inicia una transacción utilizando un cajero automático, la programación de la máquina inicia una búsqueda de información relevante de la cuenta, localiza los datos y luego determina si el monto de la transacción reducirá el saldo de la cuenta por debajo de un monto permitido, según la forma en que se estructura la cuenta. A partir de ahí, la programación puede devolver datos relevantes al usuario, como documentar la finalización exitosa de la transacción solicitada y proporcionar el saldo de la cuenta restante después de registrar el crédito o débito relacionado con la transacción.

Otro ejemplo común de minería de flujo de datos es la búsqueda web básica usando un navegador. Con esta aplicación, el usuario final ingresa los valores de búsqueda en un campo, y el software que impulsa el navegador busca interpretar esos valores y devolver datos que tienen alguna relevancia para los criterios de búsqueda. Dependiendo de cómo esté configurado el navegador, esto también puede incluir una función que busca anticipar la intención de la búsqueda y ofrecer palabras o frases adicionales que pueden ayudar a refinar la búsqueda más a gusto del usuario. Una vez que el usuario se ha decidido por la frase de búsqueda, el navegador devuelve los resultados en orden de clasificación, utilizando algoritmos que son relevantes para la configuración del navegador.

Uno de los principales beneficios de la minería de flujo de datos es la capacidad de acceder y buscar datos sin prohibir que otros utilicen esos mismos datos. Como los flujos de datos se actualizan constantemente, los resultados de la extracción pueden cambiar de vez en cuando. Por ejemplo, realizar una búsqueda en la web usando una frase de búsqueda específica puede arrojar un conjunto de resultados hoy, pero proporcionará un conjunto de resultados ligeramente diferente mañana, según la información nueva que haya ingresado al flujo de datos y cómo el motor de búsqueda clasifica esos datos.