Skip to main content

¿Qué son las clases de histograma?

Las clases de histograma son rangos de valores que contienen puntos de datos en una distribución de frecuencia o tabulación de datos sin procesar. También se les conoce como intervalos, intervalos o anchos de depósito. En un histograma, un tipo de gráfico de barras, estas clases se representan como columnas verticales donde la altura de la columna indica el número de puntos de datos contenidos en el rango de la clase. Por lo general, la elección de la clase de histograma se realiza para mejorar la representación visual de estadísticas o tendencias de datos.

Cuando hay una gran cantidad de datos para mostrar, un histograma es particularmente útil para representar la forma de su distribución. Se divide un rango completo de datos en intervalos y se cuenta el número de puntos de datos que caen en cada uno para obtener la frecuencia de la clase. El rango, o ancho, del intervalo determina el número de clases de histograma e influye en la forma del gráfico.

Si el intervalo es demasiado amplio, las clases pueden ser omitidas si las clases son demasiado inclusivas. Cuando la elección del ancho del intervalo es demasiado estrecha, la baja frecuencia de clase podría dar una importancia excesiva a lo que en realidad es una variación aleatoria. Existen varios métodos para establecer un número apropiado de clases de histograma para un conjunto de datos.

De acuerdo con la regla de Sturgis, el número de clases debe estar cerca del registro base 2 del número de puntos de datos, más uno. Usando la regla de Rice, el número de clases definidas debería ser el doble de la raíz cúbica del número de puntos de datos. Cualquiera que sea el método utilizado para seleccionar el número de clases de histograma, se deben probar varios anchos diferentes para probar la sensibilidad de la forma del histograma al tamaño de la clase. El número correcto de clases es el que representa con mayor precisión la distribución de los datos.

Con el número adecuado de clases de histograma para un rango de datos, debe producirse una representación gráfica significativa que permita una interpretación clara. Un histograma debe mostrar el centro y la dispersión de los datos, cualquier asimetría o asimetría de datos, y valores atípicos o puntos de datos que ocurran fuera del rango esperado de valores. El modo, o el valor más frecuente, debe ser evidente, así como las agrupaciones que podrían indicar una modalidad múltiple. El análisis de histograma también puede indicar fallas en el proceso de recopilación de datos.

Utilizados durante mucho tiempo en las finanzas y las ciencias sociales, los histogramas son cada vez más familiares en las pantallas gráficas de la electrónica de consumo. La fotografía digital está particularmente abierta a su uso, con muchas cámaras que incorporan un histograma de color para indicar el balance de blancos y la exposición. Un histograma de fotografía digital también puede mostrar píxeles como clases de histograma trazadas contra tonos de gris.