Skip to main content

¿Qué es la extracción de conocimiento?

La extracción de conocimiento es el proceso de hacer uso de varias fuentes de información para crear un banco de conocimiento coherente. Como parte de este enfoque, la extracción a menudo se basará en una variedad de fuentes estructuradas y no estructuradas. Cuando tiene éxito, la extracción de conocimiento da como resultado datos sólidos que un programa determinado puede leer e interpretar fácilmente, lo que permite al usuario final utilizar ese conocimiento formal para cualquier propósito que desee.

Se pueden utilizar varias fuentes diferentes en el proceso de extracción de conocimiento. Dentro del alcance de las fuentes estructuradas, los datos pueden extraerse de varios tipos de bases de datos relacionales o algún tipo de lenguaje de marcado extensible o fuente XML. Como parte del proceso de extracción, se pueden utilizar fuentes no estructuradas, como imágenes, diferentes formas de documentos de procesamiento de texto, hojas de cálculo e incluso texto capturado en programas de estilo de bloc de notas. Siempre y cuando las fuentes sean legibles para que el programa se use para administrar el proceso de extracción de conocimiento, pueden usarse como fuentes que expanden el potencial del proyecto que se está avanzando mediante la extracción y permiten que el conocimiento final producido sea utilizable. .

Hay varias aplicaciones comunes que ocurren con la extracción de conocimiento. Un ejemplo frecuente es la capacidad de capturar datos de una fuente no estructurada e incorporarla a algún tipo de fuente de conocimiento estructurado. Extraer datos encontrados en bases de datos relacionales y usarlos para crear nuevos documentos, o hacer uso de documentos electrónicos para importar datos en bases de datos relacionales, es otro ejemplo de cómo este tipo de extracción puede acelerar el intercambio de conocimiento formal sin la necesidad de ingresar datos manualmente. eso ya está disponible de alguna otra fuente. Esta reutilización del conocimiento existente en algún formato nuevo a menudo es muy útil en una serie de escenarios, lo que hace posible utilizar ese conocimiento de formas que podrían no haber sido posibles con la fuente existente. De esta manera, el usuario puede crear fuentes que son ideales para una serie de aplicaciones diferentes en lugar de solo aquellas relevantes para el hogar original del conocimiento formal.

Con el uso de la extracción de datos, es posible hacer uso de un vasto almacén de datos, importando y exportando datos fácilmente como una forma de crear una nueva fuente que sea utilizable para un propósito específico. A su vez, estas fuentes recién creadas también encuentran un lugar en el almacén de datos y eventualmente pueden usarse en la creación de nuevas extracciones que se usan para satisfacer las necesidades de uso más nuevas. Con esto en mente, la extracción de conocimiento puede verse como una herramienta muy útil que ayuda a aprovechar al máximo todos los recursos disponibles actualmente, simplificando muchas de las tareas involucradas con el intercambio de ese conocimiento formal.