Skip to main content

¿Qué es el vocabulario controlado?

El vocabulario controlado es un concepto en ciencias de la computación y programación de computadoras que involucra el uso de términos previamente acordados o aprobados al construir bases de datos relacionales, metadatos de búsqueda u otros sistemas en los que se usan palabras legibles para marcar información para su posterior recuperación. La metodología de usar un vocabulario controlado para clasificar la información contrasta directamente con el concepto de vocabulario del lenguaje natural, en el que no hay términos acordados y todas las palabras que se usan están conectadas por relaciones ponderadas. Además de las palabras de nivel superior que se usan en un vocabulario controlado, se pueden usar palabras de apoyo para que los sinónimos u otros términos que estén fuertemente asociados con el término de nivel superior puedan activar el uso de la palabra de nivel superior. Las principales diferencias que se miden entre los sistemas de lenguaje natural y los sistemas de vocabulario controlado son la relevancia de los resultados de una consulta utilizando las palabras, el volumen de información devuelta y la usabilidad general del sistema.

Hay muchos casos en los que se usa una colección de palabras o términos para hacer que la información que es arbitraria, que cambia constantemente o que esté desorganizada sea más accesible para los usuarios. Los términos de búsqueda dentro de un motor de búsqueda de Internet, una base de datos de información corporativa e incluso una biblioteca de investigación digital son ejemplos de aplicaciones a través de las cuales la información se puede clasificar con términos de metadatos en lugar de una estructura jerárquica estricta. Las palabras utilizadas para describir un objeto en tales situaciones crean una especie de índice de búsqueda del conjunto de información más grande.

Se puede ver un ejemplo del uso de vocabulario controlado cuando se considera un sistema de archivo para una empresa. Los archivos deben clasificarse de forma tal que puedan recuperarse de manera fácil y predecible. Si un archivo trata de automóviles, entonces podría archivarse en la categoría "automóviles". Si otra persona también tiene un archivo que trata con automóviles, sin un vocabulario controlado, el archivo podría colocarse bajo el título "automóviles", haciendo que los dos archivos sean difíciles de encontrar con una sola búsqueda. Cuando se controlan las categorías, todos los archivos relacionados con automóviles se colocarán bajo un solo título acordado.

El beneficio de usar un vocabulario controlado es que la información se describe estrictamente de manera predecible. Esto significa que cualquiera que conozca el vocabulario podrá buscar información de manera efectiva y precisa. Sin embargo, una complicación con el vocabulario es que los términos de búsqueda son más difíciles, si no imposibles, de generar automáticamente y generalmente requieren alguna intervención humana, por lo que es una tarea difícil convertir las bases de datos existentes para usar un vocabulario controlado. Si el vocabulario no es lo suficientemente grande, entonces también existe la posibilidad de que una sola consulta muestre un volumen de información tan grande que resulta poco práctico ordenarla sin el uso de otro método de consulta.