Skip to main content

¿Qué es la distribución hipergeométrica?

La distribución hipergeométrica describe la probabilidad de ciertos eventos cuando una secuencia de elementos se extrae de un conjunto fijo, como elegir cartas de un mazo. La característica clave de los eventos que siguen a la distribución de probabilidad hipergeométrica es que los ítems no se reemplazan entre sorteos. Una vez que se ha elegido un objeto en particular, no se puede volver a elegir. Esta característica es más importante cuando se trabaja con poblaciones pequeñas.

Los auditores de evaluación de calidad utilizan la distribución hipergeométrica cuando analizan el número de productos defectuosos en un grupo dado. Los productos se dejan de lado después de ser probados porque no hay razón para probar el mismo producto dos veces. Por lo tanto, la selección se realiza sin reemplazo.

Las probabilidades de póker se calculan utilizando la distribución hipergeométrica porque las cartas no se barajan nuevamente en el mazo dentro de una mano determinada. Inicialmente, por ejemplo, una cuarta parte de las cartas en un mazo estándar son espadas, pero la probabilidad de recibir dos cartas y encontrar que ambas sean espadas no es 1/4 * 1/4 = 1/16. Después de recibir la primera espada, quedan menos espadas en el mazo, por lo que la probabilidad de recibir otra espada es solo 12/51. Por lo tanto, la probabilidad de recibir dos cartas y descubrir que ambas son espadas es 1/4 * 12/51 = 1/17.

Los objetos no se reemplazan entre dibujos, por lo que la probabilidad de escenarios extremos se reduce para una distribución hipergeométrica. Se puede comparar que se repartan cartas rojas o negras de un mazo estándar con lanzar una moneda. Una moneda justa caerá en "cara" la mitad del tiempo, y la mitad de las cartas en un mazo estándar son negras. Sin embargo, la probabilidad de obtener cinco caras consecutivas al lanzar una moneda es mayor que la probabilidad de recibir una mano de cinco cartas y encontrar que todas son cartas negras. La probabilidad de cinco caras consecutivas es 1/2 * 1/2 * 1/2 * 1/2 * 1/2 = 1/32, o alrededor del 3 por ciento, y la probabilidad de cinco cartas negras es 26/52 * 25 / 51 * 24/50 * 23/49 * 22/48 = 253/9996, o alrededor del 2.5 por ciento.

El muestreo sin reemplazo reduce la probabilidad de casos extremos, pero no afecta la media aritmética de la distribución. El número promedio de caras esperado cuando uno lanza una moneda cinco veces es 2.5, y esto es igual al número promedio de cartas negras que se esperan en una mano de cinco cartas. Así como es muy poco probable que las cinco cartas sean negras, tampoco es probable que ninguna lo sea. Esto se describe en lenguaje matemático al decir que el reemplazo reduce la varianza sin afectar el valor esperado de una distribución.