Skip to main content

¿Qué es una variable categórica?

Una variable categórica, que también se conoce como variable nominal, es un tipo de variable que puede tener dos o más grupos, o categorías, que pueden asignarse. No hay un orden para las categorías a las que se puede asignar una variable. En otras palabras, las categorías no se pueden ordenar de mayor a menor. Un ejemplo de una variable categórica es la raza, que tiene muchas categorías diferentes pero no hay ordenamiento para ellas.

Una forma de determinar el tipo de variable es si es cuantitativo o cualitativo. Se puede medir una variable cuantitativa y tiene un valor numérico específico. Los ejemplos de variables cuantitativas incluyen altura, peso, edad, salario, temperatura, etc. Cualquier variable que no sea cuantitativa es cualitativa o una variable categórica. Estos tipos de variables no tienen significado numérico cuando se miden u observan e incluyen cosas como el color del cabello, el color de los ojos, el género, la ciudad de nacimiento, etc.

Las variables categóricas son similares a las variables ordinales, ya que ambas tienen categorías específicas que las describen. La diferencia entre una variable categórica y una variable ordinal es que esta última tiene un orden intrínseco. Por ejemplo, una encuesta puede pedir que los encuestados clasifiquen las declaraciones como pobres, buenas y excelentes. Estas son variables categóricas, pero hay un orden obvio, por lo que en realidad son variables ordinales.

Las tablas de datos se usan generalmente para analizar datos agrupados categóricamente. Con una tabla de datos bidireccional, se pueden medir y comparar dos variables categóricas. Por ejemplo, el color del cabello y el género podrían medirse para un grupo de individuos. Las variables categóricas que se observarían y registrarían serían si la persona es hombre o mujer y de qué color es su cabello. En la tabla, el número de observaciones para cada grupo para las dos variables se ingresaría en filas y columnas según los datos recopilados.

Los gráficos de barras a menudo se usan como un método gráfico para analizar datos variables categóricos. Los datos que se observan se pueden ingresar como números brutos o como porcentajes, que son los preferidos. Con un gráfico de barras, se muestra el total de cada grupo.

En el ejemplo anterior, el gráfico de barras podría representar la cantidad de hombres o mujeres o la cantidad de individuos dentro de cada categoría de color de cabello. Un gráfico de barras segmentado puede proporcionar un método para mostrar los números capturados durante las observaciones en lugar de un total directo para cada grupo. Usando el mismo color de cabello y datos de género, un gráfico de barras segmentado podría mostrar cuántos hombres y mujeres de cada color de cabello se observaron.