Artículos

9.1: Presentación gráfica de datos categóricos - Matemáticas


Los datos categóricos o cualitativos son piezas de información que nos permiten clasificar los objetos bajo investigación en varias categorías. Por lo general, comenzamos a trabajar con datos categóricos resumiendo los datos en un tabla de frecuencia.

Tabla de frecuencia

Una tabla de frecuencias es una tabla con dos columnas. Una columna enumera las categorías y otra para las frecuencias con las que ocurren los elementos de las categorías (cuántos elementos encajan en cada categoría).

Ejemplo 1

Una compañía de seguros determina las primas de seguros de vehículos basándose en factores de riesgo conocidos. Si una persona se considera de mayor riesgo, sus primas serán más altas. Un factor potencial es el color de su automóvil. La compañía de seguros cree que las personas con algunos autos de color tienen más probabilidades de sufrir accidentes. Para investigar esto, examinan los informes policiales en busca de colisiones recientes con pérdidas totales. Los datos se resumen en la siguiente tabla de frecuencias.

ColorFrecuencia
Azul25
Verde52
rojo41
blanco36
Negro39
Gris23

A veces, necesitamos una forma aún más intuitiva de mostrar datos. Aquí es donde entran los cuadros y gráficos. Hay muchas, muchas formas de mostrar datos gráficamente, pero nos concentraremos en un tipo de gráfico muy útil llamado gráfico de barras. En esta sección trabajaremos con gráficos de barras que muestran datos categóricos; la siguiente sección estará dedicada a los gráficos de barras que muestran datos cuantitativos.

Gráfico de barras

A gráfico de barras es un gráfico que muestra una barra para cada categoría con la longitud de cada barra que indica la frecuencia de esa categoría.

Para construir un gráfico de barras, necesitamos dibujar un eje vertical y un eje horizontal. La dirección vertical tendrá una escala y medirá la frecuencia de cada categoría; el eje horizontal no tiene escala en este caso. La construcción de un gráfico de barras se describe más fácilmente mediante el uso de un ejemplo.

Ejemplo 2

Usando los datos de nuestro automóvil de arriba, tenga en cuenta que la frecuencia más alta es 52, por lo que nuestro eje vertical debe ir de 0 a 52, pero también podríamos usar 0 a 55, para que podamos poner una marca de almohadilla cada 5 unidades:

Observe que la altura de cada barra está determinada por la frecuencia del color correspondiente. Las líneas de cuadrícula horizontales son un buen toque, pero no son necesarias. En la práctica, le resultará útil dibujar gráficos de barras utilizando papel cuadriculado, por lo que las líneas de cuadrícula ya estarán en su lugar o utilizando tecnología. En lugar de líneas de cuadrícula, también podríamos enumerar las frecuencias en la parte superior de cada barra, así:

En este caso, nuestro gráfico podría beneficiarse de que se reordene de los valores de frecuencia más grandes a los más pequeños. Esta disposición puede facilitar la comparación de valores similares en el gráfico, incluso sin líneas de cuadrícula. Cuando organizamos las categorías en orden de frecuencia decreciente como este, se llama diagrama de Pareto.

Diagrama de Pareto

A diagrama de Pareto es un gráfico de barras ordenado de mayor a menor frecuencia

Ejemplo 3

Transformando nuestro gráfico de barras de antes en un gráfico de Pareto, obtenemos:

Ejemplo 4

En una encuesta[1], se preguntó a los adultos si estaban personalmente preocupados por una variedad de preocupaciones ambientales. A continuación se resumen las cifras (de 1012 encuestados) que indicaron que les preocupaban "mucho" algunas preocupaciones seleccionadas.

Problema medioambientalFrecuencia
Contaminación del agua potable597
Contaminación del suelo y el agua por desechos tóxicos.526
La contaminación del aire455
Calentamiento global354

Estos datos podrían mostrarse gráficamente en un gráfico de barras:

Para mostrar tamaños relativos, es común utilizar un gráfico circular.

Gráfico circular

A Gráfico circular es un círculo con trozos cortados de diferentes tamaños marcados como rebanadas de pastel o pizza. Los tamaños relativos de las cuñas corresponden a las frecuencias relativas de las categorías.

Ejemplo 5

Para nuestros datos de color de vehículos, un gráfico circular podría verse así:

Los gráficos circulares a menudo pueden beneficiarse al incluir frecuencias o frecuencias relativas (porcentajes) en el gráfico junto a los sectores circulares. A menudo, tener los nombres de las categorías junto a los sectores circulares también hace que el gráfico sea más claro.

Ejemplo 6

El gráfico circular de la derecha muestra el porcentaje de votantes que apoyan a cada candidato que se postula para un escaño en el Senado local.

Si hay 20,000 votantes en el distrito, el gráfico circular muestra que aproximadamente el 11% de ellos, aproximadamente 2,200 votantes, apoyan a Reeves.

Los gráficos circulares se ven bien, pero son más difíciles de dibujar a mano que los gráficos de barras, ya que para dibujarlos con precisión necesitaríamos calcular el ángulo que cada cuña corta fuera del círculo y luego medir el ángulo con un transportador. Las computadoras son mucho más adecuadas para dibujar gráficos circulares. Los programas de software comunes como Microsoft Word o Excel, OpenOffice.org Write o Calc, o Google Docs pueden crear gráficos de barras, gráficos circulares y otros tipos de gráficos. También existen numerosas herramientas en línea que pueden crear gráficos.[2]

Pruébelo ahora 1

Cree un gráfico de barras y un gráfico circular para ilustrar las calificaciones en un examen de historia a continuación.

A: 12 estudiantes, B: 19 estudiantes, C: 14 estudiantes, D: 4 estudiantes, F: 5 estudiantes

¡No te pongas elegante con los gráficos! Las personas a veces agregan funciones a los gráficos que no ayudan a transmitir su información. Por ejemplo, los gráficos de barras tridimensionales como el que se muestra a continuación generalmente no son tan efectivos como sus contrapartes bidimensionales.

Aquí hay otra forma en que la fantasía puede causar problemas. En lugar de barras simples, es tentador sustituir imágenes significativas. Este tipo de gráfico se llama pictograma.

Pictograma

A pictograma es un gráfico estadístico en el que el tamaño de la imagen pretende representar las frecuencias o el tamaño de los valores que se representan.

Ejemplo 7

Un sindicato puede producir el gráfico de la derecha para mostrar la diferencia entre el salario promedio de un gerente y el salario promedio del trabajador.

Mirando la imagen, sería razonable suponer que los salarios del gerente son 4 veces más grandes que los salarios de los trabajadores; el área de la bolsa parece 4 veces más grande. Sin embargo, los salarios de los gerentes son de hecho solo dos veces más altos que los salarios de los trabajadores, lo que se refleja en la imagen al hacer que el gerente gane el doble de alto.

Otra distorsión en los gráficos de barras resulta de establecer la línea de base en un valor distinto de cero. La línea de base es la parte inferior del eje vertical, que representa el menor número de casos que podrían haber ocurrido en una categoría. Normalmente, este número debería ser cero.

Ejemplo 8

Compare los dos gráficos a continuación que muestran el apoyo a los derechos al matrimonio entre personas del mismo sexo de una encuesta realizada en diciembre de 2008[3]. La diferencia en la escala vertical en el primer gráfico sugiere una historia diferente a las verdaderas diferencias en porcentajes; el segundo gráfico hace que parezca que el doble de personas se oponen al derecho al matrimonio que lo apoyan.

Pruébelo ahora 2

Se realizó una encuesta preguntando a la gente si estaba de acuerdo con las posiciones de los 4 candidatos para una oficina del condado. ¿El gráfico circular presenta una buena representación de estos datos? Explicar.



Ver el vídeo: SEC 2DO B01REF04VID01A Graficas: posición-tiempo (Septiembre 2021).