Skip to main content

¿Qué es la lingüística del corpus?

Lingüística del corpus: estudio del lenguaje utilizando ejemplos de la vida real. No es una rama de la lingüística, sino una metodología o enfoque. Corpus , la palabra latina para "cuerpo", se refiere al cuerpo de textos naturales, y el enfoque implica descubrir patrones de uso del lenguaje a través del análisis del corpus. La lingüística del corpus está experimentando un regreso, ya que los programas informáticos han revolucionado el enfoque.

Los diarios de los padres sobre el habla de un niño cuando adquiere el lenguaje por primera vez son un ejemplo simple de un corpus que luego puede estudiarse para aprender patrones de lenguaje. La enseñanza de idiomas extranjeros en la primera mitad del siglo XX a menudo usaba corpus del idioma de destino para compilar listas de vocabulario para los estudiantes. El eminente lingüista Noam Chomsky no consideró el uso de corpus como una herramienta válida, ya que creía que la competencia lingüística era más importante que los datos de rendimiento. La lingüística de los primeros corpus se basó en gran medida en el supuesto de que hay un número limitado de oraciones en un lenguaje natural y que esas oraciones se pueden recopilar y evaluar.

Después de caer en desgracia en los años 60 y 70, la lingüística de corpus está experimentando un renacimiento debido al uso metodológico de la computadora. El programa de concordancia es el nombre del software más utilizado por los lingüistas. Si bien buscar patrones en un corpus de millones de palabras tomaría demasiado tiempo para un ser humano y los resultados serían menos que precisos, una computadora puede buscar y recuperar información en cuestión de segundos. Puede calcular la frecuencia, ordenar datos y explotar cuerpos de formas imposibles en el pasado.

El análisis basado en corpus puede analizar cómo el registro afecta el lenguaje; patrones de uso del lenguaje, como cómo los hombres y las mujeres hacen un uso diferente de las preguntas de etiqueta; la medida en que se usan los patrones del lenguaje; y los factores que afectan la variabilidad del uso del lenguaje. La enseñanza puede beneficiarse de la lingüística del corpus en el diseño del plan de estudios, el desarrollo de los materiales utilizados y el tipo de actividades utilizadas en el aula. Los estudiantes podrían beneficiarse del enfoque al poder determinar más claramente los diferentes usos y significados de las palabras comunes, las diferencias inherentes en el lenguaje escrito y hablado, y las frases y colocaciones que podrían utilizar. El cuerpo de datos que es el corpus se actualiza constantemente y es el producto de las interacciones sociales de la vida real. Por lo tanto, los corpus son datos naturalistas a los que se puede acceder fácilmente, y los resultados pueden generalizarse.