Skip to main content

¿Cuáles son los diferentes métodos de minería de datos?

Hay una variedad de diferentes métodos de minería de datos utilizados tanto en las opciones de software como en los conceptos teóricos. Esto permite a los usuarios extraer información de los datos recopilados por individuos y empresas utilizando una variedad de herramientas. Se pueden utilizar grandes cantidades de datos para determinar varios factores en un solo sujeto o variedad de sujetos. Estos métodos de minería de datos se utilizan con mayor frecuencia en los campos de protección contra fraudes, comercialización y vigilancia.

Durante cientos de años, los métodos de minería de datos se han utilizado para extraer información de los sujetos. Sin embargo, las técnicas modernas utilizan conceptos automatizados para proporcionar datos sustanciales a través de recursos computarizados. A medida que surgieron las ciencias de la computación durante el siglo XX, el concepto de métodos de minería de datos se desarrolló en un esfuerzo por superar patrones ocultos en grandes extensiones de datos recopilados. Un buen ejemplo de esto es cuando una empresa de publicidad analiza los patrones de compra de un cliente en línea. Esta compañía puede entonces comercializar ciertos productos que el individuo puede estar interesado en comprar.

Una técnica de minería de datos utilizada comúnmente en la industria se llama Descubrimiento de conocimiento en bases de datos (KDD). Desarrollado en 1989 por Gregory Piatetsky-Shapiro, KDD permite a los usuarios procesar datos sin procesar, analizar la información de los datos necesarios e interpretar los resultados. Este método permite a los usuarios encontrar patrones en los algoritmos, sin embargo, los datos generales no siempre son precisos y se pueden agrupar de manera comprometedora. Esto se conoce como sobreajuste .

Los métodos básicos de minería de datos involucran cuatro tipos particulares de tareas: clasificación, agrupamiento, regresión y asociación. La clasificación toma la información presente y la combina en grupos definidos. La agrupación elimina las agrupaciones definidas y permite que los datos se clasifiquen por elementos similares. La regresión se centra en la función de la información, modelando los datos en concepto. El método final de minería de datos, asociación , intenta encontrar relaciones entre los diversos feeds de datos.

Cuando se usan los diversos métodos de minería de datos, se usan ciertos estándares para determinar qué parámetros se pueden usar en el proceso. El Grupo de Interés Especial de la Association for Computing Machinery sobre descubrimiento de conocimiento y minería de datos (SIGKDD) celebra una reunión anual para determinar qué procesos son apropiados. Los factores éticos se sopesan junto con aplicaciones prácticas para encontrar la mejor información sobre individuos y empresas. Esta información se publica en una revista de la industria llamada SIGKDD Explorations.