Ciencias

¿Qué es una prueba no paramétrica?

Una prueba no paramétrica es un tipo de prueba de hipótesis estadística que no asume una distribución normal. Por esta razón, las pruebas no paramétricas a veces se denominan libres de distribución. Una prueba no paramétrica es más robusta que una prueba estándar, generalmente requiere muestras más pequeñas, es menos probable que se vea afectada por observaciones externas y puede aplicarse con menos suposiciones. Por otro lado, las pruebas no paramétricas pueden ser menos eficientes que sus contrapartes estándar, particularmente si la población realmente se distribuye normalmente. Las pruebas no paramétricas son particularmente efectivas para preguntas relacionadas con frecuencias y proporciones.

La prueba de hipótesis estándar compara una muestra de una población de prueba con una muestra de una población de control para determinar si la población de prueba es estadísticamente comparable a la población de control. Si la diferencia entre el parámetro o los parámetros de la muestra, generalmente la media y / o la varianza, es lo suficientemente grande, se puede considerar que la muestra de prueba es distinta de la población de control. Dichas pruebas paramétricas requieren que los parámetros provengan de una distribución normal.

Se ha demostrado matemáticamente que un tamaño de muestra de 30 o más se comportará aproximadamente como una distribución normal, por lo que generalmente se asume este requisito. Sin embargo, si el supuesto no está justificado, los resultados de las pruebas podrían no ser válidos. Las pruebas no paramétricas evitan esta suposición.

En cambio, las pruebas de hipótesis no paramétricas comúnmente examinan los datos categorizándolos o ordenándolos. Si la muestra y las poblaciones de control son las mismas y si los datos se recopilaron correctamente, cualquier diferencia entre sus categorías o clasificaciones es estrictamente el resultado de la casualidad. Si la probabilidad de que esas diferencias pudieran haber ocurrido por casualidad, también llamada valor P, es menor que una probabilidad significativa elegida, generalmente 5 por ciento o 1 por ciento, entonces el evaluador rechaza la hipótesis de que la muestra y las poblaciones de control son las igual y concluye que son diferentes.

Una prueba no paramétrica común es una prueba de Chi-cuadrado, utilizada para comparar frecuencias o proporciones observadas. Cuando solo se examina un conjunto de frecuencias, esto a menudo se denomina prueba de bondad de ajuste y se usa para determinar si las frecuencias observadas se ajustan al rango que se esperaría. Por ejemplo, una prueba de bondad de ajuste podría usarse para determinar si una mesa de ruleta había sido manipulada comparando los resultados de la mesa con los resultados que predice la teoría de probabilidad o para determinar si un medicamento para el dolor de cabeza fue efectivo al comparar la proporción de personas cuyo dolor de cabeza mejoró el medicamento a la proporción de personas cuyo dolor de cabeza mejoró cuando tomaron un placebo. Si se examinan dos frecuencias, entonces la prueba no paramétrica de Chi-cuadrado puede usarse para probar la correlación o independencia entre los factores. Los encuestadores políticos a menudo buscan una correlación entre los factores sociales, económicos o demográficos y las creencias políticas, como ver si existe una correlación entre la educación de una persona y si él o ella aprueba el desempeño de un funcionario electo.

Otra prueba no paramétrica es la prueba de suma de rango de Wilcoxon, que generalmente se usa en las mismas situaciones que la prueba de hipótesis paramétrica estándar. Sin embargo, en lugar de examinar la media de cada muestra, la prueba de Wilcoxon examina el rango de cada valor si las dos muestras se ordenan de menor a mayor. Si las dos muestras son iguales, cada grupo debe estar distribuido uniformemente en la clasificación. Si un grupo está agrupado en el extremo inferior o superior de la clasificación, esto indica que los dos grupos son diferentes.

Por ejemplo, suponga que alguien quisiera determinar si las películas animadas son más largas o más cortas que las películas no animadas. Para una prueba estándar, él o ella determinarían la duración promedio de una muestra de películas animadas y una muestra de películas de acción real y compararían la diferencia con la varianza de las muestras. Para la prueba no paramétrica de Wilcoxon, los tiempos de las películas se ordenan de menor a mayor, y se suman los rangos de los tiempos de las películas animadas.

La persona podría calcular la probabilidad de que la suma de rango sea de ese tamaño o menor determinando el número de posibles pedidos con una suma de rango dada y el número total de posibles pedidos, un cálculo que es simple dada la suficiente fuerza de cálculo de fuerza bruta. Con dos pequeñas muestras de seis películas cada una, ya hay 924 posibles arreglos de clasificaciones, un número que crece rápidamente a medida que se agregan películas. Alternativamente, hay tablas publicadas que dan probabilidades correspondientes a sumas de rango dadas para tamaños de muestra dados. Estos se pueden encontrar en textos estadísticos o en línea.

Las pruebas no paramétricas son un campo en crecimiento. Se puede aplicar en cualquier campo en el que también se hayan utilizado estadísticas más convencionales. Sin embargo, las aplicaciones son particularmente comunes en las ciencias sociales y la medicina, particularmente cuando la distribución normal no puede aplicarse.