Artículos

1.2.3: Histogramas, polígonos de frecuencia y gráficos de series de tiempo


Para la mayor parte del trabajo que realice en este libro, utilizará un histograma para mostrar los datos. Una ventaja de un histograma es que puede mostrar fácilmente grandes conjuntos de datos. Una regla general es utilizar un histograma cuando el conjunto de datos consta de 100 valores o más.

Un histograma consta de cuadros contiguos (contiguos). Tiene un eje horizontal y un eje vertical. El eje horizontal está etiquetado con lo que representan los datos (por ejemplo, la distancia desde su casa a la escuela). El eje vertical está etiquetado como frecuencia o frecuencia relativa (o porcentaje de frecuencia o probabilidad). El gráfico tendrá la misma forma con cualquiera de las etiquetas. El histograma (como el diagrama de pasos) puede darle la forma de los datos, el centro y la extensión de los datos.

La frecuencia relativa es igual a la frecuencia para un valor observado de los datos dividido por el número total de valores de datos en la muestra (recuerde, la frecuencia se define como el número de veces que ocurre una respuesta).

  • (f ) es la frecuencia
  • (n ) es el número total de valores de datos (o la suma de las frecuencias individuales), y
  • (RF ) es la frecuencia relativa,

luego:

[RF = dfrac {f} {n} label {2.3.1} ]

Por ejemplo, si tres estudiantes en la clase de inglés del Sr. Ahab de 40 estudiantes recibieron de 90% a 100%, entonces, f = 3, n = 40 y RF = fn = 340 = 0.075. El 7,5% de los estudiantes recibió entre el 90% y el 100%. 90-100% son medidas cuantitativas.

Para construir un histograma, primero decida cuántas barras o intervalos, también llamados clases, representan los datos. Muchos histogramas constan de cinco a 15 barras o clases para mayor claridad. Es necesario elegir el número de barras. Elija un punto de partida para que el primer intervalo sea menor que el valor de datos más pequeño. Un punto de partida conveniente es un valor más bajo llevado a un lugar decimal más que el valor con el mayor número de lugares decimales. Por ejemplo, si el valor con la mayor cantidad de decimales es 6.1 y este es el valor más pequeño, un punto de partida conveniente es (6.05 (6.1 - 0.05 = 6.05) ). Decimos que 6.05 tiene más precisión. Si el valor con la mayor cantidad de decimales es 2.23 y el valor más bajo es 1.5, un punto de partida conveniente es (1.495 (1.5 - 0.005 = 1.495) ). Si el valor con más posiciones decimales es 3.234 y el valor más bajo es 1.0, un punto de partida conveniente es (0.9995 (1.0 - 0.0005 = 0.9995) ). Si todos los datos son números enteros y el valor más pequeño es dos, entonces un punto de partida conveniente es (1.5 (2 - 0.5 = 1.5) ). Además, cuando el punto de partida y otros límites se llevan a un decimal adicional, ningún valor de datos caerá en un límite. Los siguientes dos ejemplos detallan cómo construir un histograma usando datos continuos y cómo crear un histograma usando datos discretos.

Ejemplo ( PageIndex {1} )

Los siguientes datos son las alturas (en pulgadas redondeadas a la media pulgada más cercana) de 100 jugadores de fútbol semiprofesionales masculinos. Las alturas son continuo datos, ya que se mide la altura.

60; 60.5; 61; 61; 61.5

63.5; 63.5; 63.5

64; 64; 64; 64; 64; 64; 64; 64.5; 64.5; 64.5; 64.5; 64.5; 64.5; 64.5; 64.5

66; 66; 66; 66; 66; 66; 66; 66; 66; 66; 66.5; 66.5; 66.5; 66.5; 66.5; 66.5; 66.5; 66.5; 66.5; 66.5; 66.5; 67; 67; 67; 67; 67; 67; 67; 67; 67; 67; 67; 67; 67.5; 67.5; 67.5; 67.5; 67.5; 67.5; 67.5

68; 68; 69; 69; 69; 69; 69; 69; 69; 69; 69; 69; 69.5; 69.5; 69.5; 69.5; 69.5

70; 70; 70; 70; 70; 70; 70.5; 70.5; 70.5; 71; 71; 71

72; 72; 72; 72.5; 72.5; 73; 73.5

74

El valor de datos más pequeño es 60. Dado que los datos con la mayor cantidad de lugares decimales tienen un decimal (por ejemplo, 61.5), queremos que nuestro punto de partida tenga dos lugares decimales. Dado que los números 0.5, 0.05, 0.005, etc. son números convenientes, use 0.05 y réstelo de 60, el valor más pequeño, como punto de partida conveniente.

60 - 0.05 = 59.95 que es más preciso que, digamos, 61.5 por un lugar decimal. El punto de partida es, entonces, 59,95.

El valor más grande es 74, por lo que 74 + 0.05 = 74.05 es el valor final.

A continuación, calcule el ancho de cada barra o intervalo de clase. Para calcular este ancho, reste el punto de inicio del valor final y divida por el número de barras (debe elegir el número de barras que desee). Suponga que elige ocho compases.

[ dfrac {74.05−59.95} {8} = 1.76 ]

Redondearemos a dos y haremos que cada barra o intervalo de clase tenga dos unidades de ancho. Redondear a dos es una forma de evitar que un valor caiga en un límite. A menudo es necesario redondear al siguiente número, incluso si va en contra de las reglas estándar de redondeo. Para este ejemplo, usar 1,76 como ancho también funcionaría. Una pauta seguida por algunos para el ancho de una barra o intervalo de clase es tomar la raíz cuadrada del número de valores de datos y luego redondear al número entero más cercano, si es necesario. Por ejemplo, si hay 150 valores de datos, tome la raíz cuadrada de 150 y redondee a 12 barras o intervalos.

Los límites son:

  • 59.95
  • 59.95 + 2 = 61.95
  • 61.95 + 2 = 63.95
  • 63.95 + 2 = 65.95
  • 65.95 + 2 = 67.95
  • 67.95 + 2 = 69.95
  • 69.95 + 2 = 71.95
  • 71.95 + 2 = 73.95
  • 73.95 + 2 = 75.95

Las alturas de 60 a 61,5 pulgadas están en el intervalo 59,95–61,95. Las alturas que son 63,5 están en el intervalo 61,95–63,95. Las alturas que van de 64 a 64,5 están en el intervalo 63,95–65,95. Las alturas de 66 a 67,5 están en el intervalo de 65,95 a 67,95. Las alturas de 68 a 69,5 están en el intervalo 67,95–69,95. Las alturas de 70 a 71 están en el intervalo 69,95–71,95. Las alturas 72 a 73,5 están en el intervalo 71,95–73,95. La altura 74 está en el intervalo 73,95–75,95.

El siguiente histograma muestra las alturas en el X-eje y frecuencia relativa en el y-eje.

Figura ( PageIndex {1} ): Histograma de algo

Ejercicio ( PageIndex {1} )

Los siguientes datos son las tallas de zapatos de 50 estudiantes varones. Las tallas son datos discretos ya que la talla del zapato se mide solo en unidades enteras y medias. Construya un histograma y calcule el ancho de cada barra o intervalo de clase. Suponga que elige seis compases.

9; 9; 9.5; 9.5; 10; 10; 10; 10; 10; 10; 10.5; 10.5; 10.5; 10.5; 10.5; 10.5; 10.5; 10.5
11; 11; 11; 11; 11; 11; 11; 11; 11; 11; 11; 11; 11; 11.5; 11.5; 11.5; 11.5; 11.5; 11.5; 11.5
12; 12; 12; 12; 12; 12; 12; 12.5; 12.5; 12.5; 12.5; 14

Respuesta

Valor mínimo: 9

Valor máximo: 14

Valor inicial conveniente: 9 - 0.05 = 8.95

Valor final conveniente: 14 + 0.05 = 14.05

( frac {14.05-8.95} {6} ) = 0.85

Los cálculos sugieren usar 0,85 como ancho de cada barra o intervalo de clase. También puede utilizar un intervalo con un ancho igual a uno.

Ejemplo ( PageIndex {2} )

Los siguientes datos son la cantidad de libros comprados por 50 estudiantes universitarios a tiempo parcial en ABC College. La cantidad de libros es datos discretos, ya que los libros se cuentan.

1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1
2; 2; 2; 2; 2; 2; 2; 2; 2; 2
3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3
4; 4; 4; 4; 4; 4
5; 5; 5; 5; 5
6; 6

Once estudiantes compran un libro. Diez estudiantes compran dos libros. Dieciséis estudiantes compran tres libros. Seis estudiantes compran cuatro libros. Cinco estudiantes compran cinco libros. Dos estudiantes compran seis libros.

Debido a que los datos son números enteros, reste 0.5 de 1, el valor de datos más pequeño y agregue 0.5 a 6, el valor de datos más grande. Entonces el punto de partida es 0.5 y el valor final es 6.5.

A continuación, calcule el ancho de cada barra o intervalo de clase. Si los datos son discretos y no hay demasiados valores diferentes, lo más conveniente es un ancho que coloque los valores de los datos en el medio de la barra o del intervalo de clase. Dado que los datos consisten en los números 1, 2, 3, 4, 5, 6 y el punto de partida es 0.5, un ancho de uno coloca el 1 en el medio del intervalo de 0.5 a 1.5, el 2 en el medio de el intervalo de 1.5 a 2.5, el 3 en el medio del intervalo de 2.5 a 3.5, el 4 en el medio del intervalo de _______ a _______, el 5 en el medio del intervalo de _______ a _______, y el _______ en la mitad del intervalo de _______ a _______.

Respuesta

Calcule el número de barras de la siguiente manera:

( frac {6.5 - 0.5} { text {número de barras}} ) = 1

donde 1 es el ancho de una barra. Por lo tanto, barras = 6.

El siguiente histograma muestra el número de libros en el X-eje y la frecuencia en el y-eje.

Figura ( PageIndex {2} ).

Nota

Vaya a [enlace]. Hay instrucciones de calculadora para ingresar datos y para crear un histograma personalizado. Cree el histograma por ejemplo.

  • Presione Y =. Presione CLEAR para borrar cualquier ecuación.
  • Presione STAT 1: EDIT. Si L1 tiene datos, presione la flecha hacia arriba hasta el nombre L1, presione BORRAR y luego la flecha hacia abajo. Si es necesario, haga lo mismo para L2.
  • En L1, ingrese 1, 2, 3, 4, 5, 6.
  • En L2, ingrese 11, 10, 16, 6, 5, 2.
  • Presione VENTANA. Establezca Xmin = .5, Xscl = (6.5 - .5) / 6, Ymin = –1, Ymax = 20, Yscl = 1, Xres = 1.
  • Presione 2Dakota del Norte Y =. Comience presionando 4: Plotsoff ENTER.
  • Presione 2Dakota del Norte Y =. Presione 1: Plot1. Presione ENTER. Flecha hacia abajo hasta TIPO. Flecha al 3rdimagen (histograma). Presione ENTER.
  • Flecha hacia abajo a Xlist: Ingrese L1 (2Dakota del Norte 1). Flecha hacia abajo hasta Freq. Ingrese L2 (2Dakota del Norte 2).
  • Presione GRÁFICO.
  • Utilice la tecla TRACE y las teclas de flecha para examinar el histograma.

Ejercicio ( PageIndex {2} )

Los siguientes datos son el número de deportes practicados por 50 estudiantes deportistas. El número de deportes es un dato discreto, ya que se cuentan los deportes.

1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1

2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2
3; 3; 3; 3; 3; 3; 3; 3

20 estudiantes deportistas practican un deporte. 22 estudiantes deportistas practican dos deportes. Ocho estudiantes deportistas practican tres deportes.

Complete los espacios en blanco para la siguiente oración. Dado que los datos consisten en los números 1, 2, 3 y el punto de partida es 0.5, un ancho de uno coloca el 1 en el medio del intervalo de 0.5 a _____, el 2 en el medio del intervalo de _____ a _____, y el 3 en el medio del intervalo de _____ a _____.

Respuesta

1.5

1,5 hasta 2,5

2,5 hasta 3,5

Ejemplo ( PageIndex {3} )

Con este conjunto de datos, construya un histograma.

Número de horas que mis compañeros de clase pasan jugando a videojuegos los fines de semana
9.95102.2516.750
19.522.57.51512.75
5.5111020.7517.5
2321.92423.7518
201522.918.820.5

Respuesta

Figura ( PageIndex {3} ).

Algunos valores de este conjunto de datos caen dentro de los límites de los intervalos de clase. Un valor se cuenta en un intervalo de clase si cae en el límite izquierdo, pero no si cae en el límite derecho. Diferentes investigadores pueden configurar histogramas para los mismos datos de diferentes formas. Hay más de una forma correcta de configurar un histograma.

Ejercicio ( PageIndex {3} )

Los siguientes datos representan la cantidad de empleados en varios restaurantes de la ciudad de Nueva York. Con estos datos, cree un histograma.

22; 35; 15; 26; 40; 28; 18; 20; 25; 34; 39; 42; 24; 22; 19; 27; 22; 34; 40; 20; 38 y 28

Utilice 10-19 como primer intervalo.

Cuente el dinero (billetes y cambio) en su bolsillo o cartera. Su instructor registrará las cantidades. Como clase, construyan un histograma que muestre los datos. Discuta cuántos intervalos cree que son apropiados. Es posible que desee experimentar con el número de intervalos.

Polígonos de frecuencia

Los polígonos de frecuencia son análogos a los gráficos de líneas, y así como los gráficos de líneas hacen que los datos continuos sean visualmente fáciles de interpretar, también lo hacen los polígonos de frecuencia. Para construir un polígono de frecuencia, primero examine los datos y decida el número de intervalos, o intervalos de clase, para usar en el X-eje y y-eje. Después de elegir los rangos apropiados, comience a trazar los puntos de datos. Después de trazar todos los puntos, dibuje segmentos de línea para conectarlos.

Ejemplo ( PageIndex {4} )

Se construyó un polígono de frecuencias a partir de la siguiente tabla de frecuencias.

Distribución de frecuencia para las puntuaciones de la prueba final de cálculo
Límite inferiorLímite superiorFrecuenciaFrecuencia acumulada
49.559.555
59.569.51015
69.579.53045
79.589.54085
89.599.515100

Figura ( PageIndex {4} ).

La primera etiqueta en el X-eje es 44,5. Esto representa un intervalo que se extiende desde 39,5 hasta 49,5. Dado que la puntuación más baja de la prueba es 54,5, este intervalo se utiliza solo para permitir que el gráfico toque el X-eje. El punto etiquetado 54,5 representa el siguiente intervalo, o el primer intervalo "real" de la tabla, y contiene cinco puntuaciones. Este razonamiento se sigue para cada uno de los intervalos restantes con el punto 104.5 representando el intervalo de 99.5 a 109.5. Nuevamente, este intervalo no contiene datos y solo se usa para que el gráfico toque el X-eje. Mirando el gráfico, decimos que esta distribución está sesgada porque un lado del gráfico no refleja el otro lado.

Ejercicio ( PageIndex {4} )

Construya un polígono de frecuencias de las edades de los presidentes de EE. UU. En la toma de posesión que se muestra en la Tabla.

Edad al momento de la inauguraciónFrecuencia
41.5–46.54
46.5–51.511
51.5–56.514
56.5–61.59
61.5–66.54
66.5–71.52

Respuesta

La primera etiqueta en el X-eje es 39. Esto representa un intervalo que se extiende desde 36,5 a 41,5. Dado que no hay edades menores de 41,5 años, este intervalo se utiliza solo para permitir que la gráfica toque la X-eje. El punto con la etiqueta 44 representa el siguiente intervalo, o el primer intervalo "real" de la tabla, y contiene cuatro puntuaciones. Este razonamiento se sigue para cada uno de los intervalos restantes con el punto 74 representando el intervalo de 71,5 a 76,5. Mirando el gráfico, decimos que esta distribución está sesgada porque un lado del gráfico no refleja el otro lado.

.
Figura ( PageIndex {5} ).

Los polígonos de frecuencia son útiles para comparar distribuciones. Esto se logra superponiendo los polígonos de frecuencia dibujados para diferentes conjuntos de datos.

Ejemplo ( PageIndex {5} )

Construiremos un polígono de frecuencia superpuesto comparando los puntajes del Ejemplo con la calificación numérica final de los estudiantes.

Distribución de frecuencia para las puntuaciones de la prueba final de cálculo
Límite inferiorLímite superiorFrecuenciaFrecuencia acumulada
49.559.555
59.569.51015
69.579.53045
79.589.54085
89.599.515100
Distribución de frecuencia para las calificaciones finales de cálculo
Límite inferiorLímite superiorFrecuenciaFrecuencia acumulada
49.559.51010
59.569.51020
69.579.53050
79.589.54595
89.599.55100

Figura ( PageIndex {6} ).

Supongamos que queremos estudiar el rango de temperatura de una región durante todo un mes. Todos los días al mediodía anotamos la temperatura y la anotamos en un registro. Se podrían realizar diversos estudios estadísticos con estos datos. Podríamos encontrar la temperatura media o mediana del mes. Podríamos construir un histograma que muestre el número de días que las temperaturas alcanzan un cierto rango de valores. Sin embargo, todos estos métodos ignoran una parte de los datos que hemos recopilado.

Una característica de los datos que quizás deseemos considerar es la del tiempo. Dado que cada fecha está emparejada con la lectura de temperatura del día, no tenemos que pensar que los datos son aleatorios. En su lugar, podemos utilizar los tiempos dados para imponer un orden cronológico a los datos. Un gráfico que reconoce este orden y muestra la temperatura cambiante a medida que avanza el mes se denomina gráfico de serie de tiempo.

Construcción de un gráfico de serie temporal

Para construir una gráfica de series de tiempo, debemos mirar ambas partes de nuestra conjunto de datos emparejados. Comenzamos con un sistema de coordenadas cartesiano estándar. El eje horizontal se usa para trazar los incrementos de fecha o hora, y el eje vertical se usa para trazar los valores de la variable que estamos midiendo. Al hacer esto, hacemos que cada punto del gráfico corresponda a una fecha y una cantidad medida. Los puntos del gráfico suelen estar conectados mediante líneas rectas en el orden en que aparecen.

Ejemplo ( PageIndex {6} )

Los siguientes datos muestran el índice anual de precios al consumidor, cada mes, durante diez años. Construya un gráfico de series de tiempo solo para los datos del Índice de precios al consumidor anual.

AñoenefebmarabrMayojunjul
2003181.7183.1184.2183.8183.5183.7183.9
2004185.2186.2187.4188.0189.1189.7189.4
2005190.7191.8193.3194.6194.4194.5195.4
2006198.3198.7199.8201.5202.5202.9203.5
2007202.416203.499205.352206.686207.949208.352208.299
2008211.080211.693213.528214.823216.632218.815219.964
2009211.143212.193212.709213.240213.856215.693215.351
2010216.687216.741217.631218.009218.178217.965218.011
2011220.223221.309223.467224.906225.964225.722225.922
2012226.665227.663229.392230.085229.815229.478229.104
AñoagosepoctnovdicAnual
2003184.6185.2185.0184.5184.3184.0
2004189.5189.9190.9191.0190.3188.9
2005196.4198.8199.2197.6196.8195.3
2006203.9202.9201.8201.5201.8201.6
2007207.917208.490208.936210.177210.036207.342
2008219.086218.783216.573212.425210.228215.303
2009215.834215.969216.177216.330215.949214.537
2010218.312218.439218.711218.803219.179218.056
2011226.545226.889226.421226.230225.672224.939
2012230.379231.407231.317230.221229.601229.594

Respuesta

Figura ( PageIndex {7} ).

Ejercicio ( PageIndex {5} )

La siguiente tabla es una parte de un conjunto de datos de www.worldbank.org. Usa la tabla para construir una gráfica de series de tiempo para CO2 emisiones para los Estados Unidos.

CO2 Emisiones
UcraniaReino UnidoEstados Unidos
2003352,259540,6405,681,664
2004343,121540,4095,790,761
2005339,029541,9905,826,394
2006327,797542,0455,737,615
2007328,357528,6315,828,697
2008323,657522,2475,656,839
2009272,176474,5795,299,563

Figura ( PageIndex {8} ).

Usos de un gráfico de serie temporal

Los gráficos de series de tiempo son herramientas importantes en diversas aplicaciones de la estadística. Cuando se registran valores de la misma variable durante un período de tiempo prolongado, a veces es difícil discernir alguna tendencia o patrón. Sin embargo, una vez que los mismos puntos de datos se muestran gráficamente, algunas características sobresalen. Los gráficos de series de tiempo facilitan la detección de tendencias.

Revisar

A histograma es una versión gráfica de una distribución de frecuencia. La escala horizontal representa clases de valores de datos cuantitativos y la escala vertical representa frecuencias. Las alturas de las barras corresponden a valores de frecuencia. Los histogramas se utilizan normalmente para conjuntos de datos cuantitativos grandes y continuos. También se puede utilizar un polígono de frecuencia al graficar grandes conjuntos de datos con puntos de datos que se repiten. Los datos generalmente continúan y-eje con la frecuencia graficada en el X-eje. Los gráficos de series de tiempo pueden ser útiles cuando se analizan grandes cantidades de datos para una variable durante un período de tiempo.

Referencias

  1. Datos sobre homicidios anuales en Detroit, 1961–73, del libro de Gunst & Mason "Análisis de regresión y su aplicación", Marcel Dekker
  2. "Cronograma: Guía para los presidentes de EE. UU.: Información sobre el lugar de nacimiento, el partido político, el mandato y más de cada presidente". Scholastic, 2013. Disponible en línea en www.scholastic.com/teachers/a...-us-presidents (consultado el 3 de abril de 2013).
  3. "Presidentes". Monstruo de hecho. Pearson Education, 2007. Disponible en línea en http://www.factmonster.com/ipka/A0194030.html (consultado el 3 de abril de 2013).
  4. "Estadísticas de seguridad alimentaria". Organización de las Naciones Unidas para la Agricultura y la Alimentación. Disponible en línea en http://www.fao.org/economic/ess/ess-fs/en/ (consultado el 3 de abril de 2013).
  5. "Índice de precios al consumidor." Departamento de Trabajo de los Estados Unidos: Oficina de Estadísticas Laborales. Disponible en línea en http://data.bls.gov/pdq/SurveyOutputServlet (consultado el 3 de abril de 2013).
  6. "Emisiones de CO2 (kt)". The World Bank, 2013. Disponible en línea en http://databank.worldbank.org/data/home.aspx (consultado el 3 de abril de 2013).
  7. "Datos de la serie temporal de nacimientos". Oficina de registro general de Escocia, 2013. Disponible en línea en www.gro-scotland.gov.uk/stati...me-series.html (consultado el 3 de abril de 2013).
  8. "Datos demográficos: niños menores de 5 años con insuficiencia ponderal". Indexmundi. Disponible en línea en http://www.indexmundi.com/g/r.aspx?t=50&v=2224&aml=en (consultado el 3 de abril de 2013).
  9. Gunst, Richard, Robert Mason. Análisis de regresión y su aplicación: un enfoque orientado a datos. Prensa CRC: 1980.
  10. "Sobrepeso y obesidad: hechos sobre la obesidad en adultos". Centros de Control y Prevención de Enfermedades. Disponible en línea en http://www.cdc.gov/obesity/data/adult.html (consultado el 13 de septiembre de 2013).
Frecuencia
la cantidad de veces que ocurre un valor de los datos
Histograma
una representación gráfica en forma (x-y ) de la distribución de datos en un conjunto de datos; (x ) representa los datos y (y ) representa la frecuencia o frecuencia relativa. El gráfico consta de rectángulos contiguos.
Frecuencia relativa
la razón entre el número de veces que ocurre un valor de los datos en el conjunto de todos los resultados y el número de todos los resultados

1.2.3: Histogramas, polígonos de frecuencia y gráficos de series de tiempo

Uno de los principales contratiempos de varios métodos de visualización de datos es que se vuelven cada vez más difíciles de leer con conjuntos de datos más grandes. El caso es bastante diferente para los histogramas, que se utilizan principalmente para visualizar grandes conjuntos de datos de datos discretos y continuos.

Los histogramas proporcionan una representación visual de datos cuantitativos mediante el uso de la altura de barras rectangulares cuidadosamente unidas para indicar la frecuencia de puntos en un intervalo de clase. Este gráfico se puede generar manualmente dibujándolo con una regla recta o digitalmente usando Excel.

La construcción de un histograma es bastante fácil cuando se hace de forma digital. Por lo tanto, este artículo cubrirá detalles sobre qué es un histograma y cómo podemos crearlos digitalmente usando Excel.


Experimento de recopilación de datos

Encuesta sobre películas Pregunte a cinco compañeros de una clase diferente cuántas películas vieron en el cine el mes pasado. No incluya películas alquiladas.

  1. Registre los datos.
  2. En clase, elija una persona al azar. En la lista de clases, marque el nombre de esa persona. Baje cuatro nombres en la lista de clases. Marque el nombre de esa persona. Continúe haciendo esto hasta que haya marcado 12 nombres. Es posible que deba volver al principio de la lista. Para cada nombre marcado, registre los cinco valores de datos. Ahora tiene un total de 60 valores de datos.
  3. Para cada nombre marcado, registre los datos.
    ____________________________________
    ____________________________________
    ____________________________________
    ____________________________________
    ____________________________________

Ordene los datos Complete las dos tablas de frecuencia relativa a continuación con los datos de su clase.


2.6 Medidas de Centrar

La media y la mediana se pueden calcular para ayudarlo a encontrar el "centro" de un conjunto de datos. A menudo, la media puede ser la mejor representación del centro de un conjunto de datos, pero la mediana suele ser más apropiada cuando un conjunto de datos contiene varios valores atípicos o extremos. El modo le dirá el datum (o datos) que ocurren con más frecuencia en su conjunto de datos.

La media de un conjunto de datos se puede aproximar a partir de una tabla de frecuencias mediante:


Histogramas, polígonos de frecuencia y gráficos de series de tiempo

Muertes por intervención legal Las muertes por intervención legal se refieren a lesiones infligidas por agentes del orden público en el curso de arrestar o intentar arrestar a infractores de la ley, reprimir disturbios, mantener el orden y otras acciones legales (incluida la ejecución legal). En 2006, 174 muertes de este tipo ocurrieron en 16 estados de los Estados Unidos. El siguiente polígono de frecuencia representa estas muertes por edad.
(LA TABLA NO SE PUEDE COPIAR)
(a) ¿Cuál es el ancho de la clase? ¿Cuántas clases están representadas en el gráfico?
(b) ¿Cuál es el punto medio de la primera clase? ¿Cuáles son los límites superior e inferior de la primera clase?
(c) ¿Cuál es el punto medio de la última clase? ¿Cuáles son los límites superior e inferior de la última clase?
(d) ¿Qué grupo de edad tuvo 35 muertes debido a la intervención legal?
(e) ¿Qué dos grupos de edad tienen el mayor número de muertes debido a la intervención legal? Estime el número de muertes para estos grupos de edad.
(f) Estime la frecuencia relativa para la clase $ 20-29 $

Para cada variable presentada, indique si espera que un histograma de los datos tenga forma de campana, sea uniforme, esté sesgado hacia la izquierda o hacia la derecha. Justifique su razonamiento. En los problemas 13 y $ 14, $ por cada variable presentada, indique si esperaría que un histograma de los datos tuviera forma de campana, uniforme, sesgado hacia la izquierda o hacia la derecha. Justifica tu razonamiento.
(a) Número de bebidas alcohólicas consumidas por semana
(b) Edades de los estudiantes en un distrito escolar público
(c) Edades de los pacientes con audífonos
(d) Alturas de los hombres adultos

Para cada variable presentada, indique si esperaría que un histograma de los datos tenga forma de campana, sea uniforme, esté sesgado hacia la izquierda o hacia la derecha. Justifique su razonamiento. En los problemas 13 y $ 14, $ por cada variable presentada, indique si esperaría que un histograma de los datos tenga forma de campana, uniforme, sesgado hacia la izquierda o hacia la derecha. Justifica tu razonamiento.
(a) Ingresos familiares anuales en los Estados Unidos
(b) Puntajes en un examen estandarizado como el SAT
(c) Número de personas que viven en un hogar
(d) Edades de los pacientes diagnosticados con la enfermedad de Alzheimer & # x27s

Edad de la población El siguiente polígono de frecuencias muestra la distribución de edad de los residentes de EE. UU. Menores de 100 años el 1 de julio de 2009.
(LA TABLA NO SE PUEDE COPIAR)
(a) ¿Cuál es el ancho de la clase? ¿Cuántas clases están representadas en el gráfico?
(b) ¿Cuál es el punto medio de la primera clase? ¿Cuáles son los límites superior e inferior de la primera clase?
(c) ¿Cuál es el punto medio de la última clase? ¿Cuáles son los límites superior e inferior de la última clase?
(d) ¿Qué grupo de edad tiene la población más alta? Estime la población de este grupo de edad.
(e) ¿Qué grupo de edad tiene la población más baja? Estime la población de este grupo de edad.
(f) Aproximadamente el número total de residentes de EE. UU. menores de 100 años al 1 de julio de 2009
(g) ¿Entre qué dos clases es más extremo el cambio en la población? ¿Menos extremo?

El histograma de frecuencia en la siguiente columna representa el número de muertes por accidentes de tráfico relacionados con el alcohol por estado (incluido Washington, D.C.) en 2008, según la Administración Nacional de Seguridad del Tráfico en las Carreteras.
(a) Determine el ancho de la clase.
(b) Identifique las clases.
(c) ¿Qué clase tiene la frecuencia más alta?
(d) Describe la forma de la distribución.
(e) Un periodista escribe la siguiente declaración: "Según los datos, Texas tuvo 1463 muertes relacionadas con el alcohol, mientras que Vermont tuvo solo $ 15. $ Así que las carreteras en Vermont son mucho más seguras". Se puede hacer una comparación justa entre las muertes por accidentes de tráfico relacionadas con el alcohol en Texas y Vermont. (LA FIGURA PUEDE & # x27T COPIAR)

Verdadero o falso: al trazar un polígono de frecuencia, trazamos los porcentajes de cada clase por encima del punto medio y conectamos los puntos con segmentos de línea.

Verdadero o falso: al trazar una ojiva, los puntos trazados tienen coordenadas $ x $ que son iguales a los límites superiores de cada clase.

El siguiente histograma de frecuencia representa los puntajes de CI de una muestra aleatoria de estudiantes de séptimo grado. Los coeficientes intelectuales se miden al número entero más cercano. La frecuencia de cada clase está etiquetada encima de cada rectángulo. (LA FIGURA PUEDE & # x27T COPIAR)
(a) ¿Cuántos estudiantes se muestrearon?
(b) Determine el ancho de la clase.
(c) Identifique las clases y sus frecuencias.
(d) ¿Qué clase tiene la frecuencia más alta?
(e) ¿Qué clase tiene la frecuencia más baja?
(f) ¿Qué porcentaje de estudiantes tenía un coeficiente intelectual de al menos 130 dólares?
(g) ¿Alguno de los estudiantes tenía un coeficiente intelectual de $ 165?

Un vendedor de autos registra la cantidad de autos que vendió cada semana durante el año pasado. El siguiente histograma de frecuencia muestra los resultados. (LA FIGURA PUEDE & # x27T COPIAR)
(a) ¿Cuál es el número más frecuente de automóviles vendidos en una semana?
(b) ¿Durante cuántas semanas se vendieron dos automóviles?
(c) Determine el porcentaje de tiempo que se vendieron dos automóviles.
(d) Describe la forma de la distribución.

Se llevó a cabo un experimento en el que se lanzaron dos dados limpios 100 veces. A continuación, se registró la suma de las pepitas que se mostraban en los dados. El siguiente histograma de frecuencia da los resultados. (LA FIGURA PUEDE & # x27T COPIAR)
(a) ¿Cuál fue el resultado más frecuente del experimento?
(b) ¿Cuál fue el menos frecuente?
(c) ¿Cuántas veces observamos un $ 7? $
(d) ¿Cuántos 5 & # x27 más se observaron que 4 & # x27?
(e) Determine el porcentaje de tiempo que se observó un 7.
(f) Describe la forma de la distribución.


Distribución discreta (Experimento de naipes)

Procedimiento El procedimiento experimental para los datos empíricos es elegir una carta de una baraja de cartas barajadas.

  1. La probabilidad teórica de sacar un diamante de una baraja es _________.
  2. Baraja una baraja de cartas.
  3. Elija una carta de ella.
  4. Registre si era un diamante o no.
  5. Vuelva a colocar la tarjeta y vuelva a barajar.
  6. Haga esto un total de diez veces.
  7. Registre el número de diamantes recogidos.
  8. Dejar X = número de diamantes. Teóricamente X

  1. Registre la cantidad de diamantes elegidos para su clase con naipes en (Figura). Luego calcule la frecuencia relativa.
    XFrecuenciaFrecuencia relativa
    0____________________
    1____________________
    2____________________
    3____________________
    4____________________
    5____________________
    6____________________
    7____________________
    8____________________
    9____________________
    10____________________
  2. Calcule lo siguiente:
    1. = ________
    2. s = ________

    1. Construya el cuadro PDF teórico basado en la distribución en la sección Procedimiento.
      XPAG(X)
      0
      1
      2
      3
      4
      5
      6
      7
      8
      9
      10
    2. Calcule lo siguiente:
      1. μ = ____________
      2. σ = ____________

      Utilice la tabla de la sección Distribución teórica para calcular las siguientes respuestas. Redondea tus respuestas a cuatro lugares decimales.

      • PAG(X = 3) = _______________________
      • PAG(1 & lt X & lt 4) = _______________________
      • PAG(X ≥ 8) = _______________________

      Utilice los datos de la sección Organizar los datos para calcular las siguientes respuestas. Redondea tus respuestas a cuatro lugares decimales.

      • RF(X = 3) = _______________________
      • RF(1 & lt X & lt 4) = _______________________
      • RF(X ≥ 8) = _______________________

      Preguntas de discusión Para las preguntas 1 y 2, piense en las formas de las dos gráficas, las probabilidades, las frecuencias relativas, las medias y las desviaciones estándar.


      Pyplot.hist () en matplotlib le permite dibujar el histograma. Requería la matriz como la entrada requerida y puede especificar el número de bins necesarios. Histograma

      Puede trazar varios histogramas en el mismo gráfico. Esto puede resultar útil si desea comparar la distribución de una variable continua agrupada por diferentes categorías.

      Usemos el conjunto de datos de diamantes del paquete ggplot2 de R. Tabla de diamantes

      Comparemos la distribución de la profundidad del diamante para 3 valores diferentes de corte de diamante en la misma parcela. Histograma múltiple

      Bueno, las distribuciones para los 3 cortes diferentes son distintivamente diferentes. Pero dado que el número de puntos de datos es mayor para el corte ideal, es más dominante.

      Entonces, ¿cómo rectificar la clase dominante y aún mantener la separación de las distribuciones?

      Puede normalizarlo estableciendo densidad = Verdadero y apilado = Verdadero. Al hacer esto, el área total debajo de cada distribución se convierte en 1. Multi Histograma 2


      :: Software gratuito de estadísticas y pronósticos ::

      Reservados todos los derechos. El uso no comercial (académico) de este software es gratuito. Lo único que se pide a cambio es citar este software cuando los resultados se utilicen en publicaciones.

      Este software gratuito en línea (calculadora) calcula los siguientes modelos de series temporales estructurales: modelo a nivel local, modelo de tendencia local y modelo estructural básico.

      Ingrese (o pegue) sus datos delimitados por retornos físicos.

      Cite este software como:
      Wessa P., (2016), Modelos de series temporales estructurales (v1.0.6) en software estadístico gratuito (v1.2.1), Oficina para el desarrollo de la investigación y la educación, URL http://www.wessa.net/rwasp_structuraltimeseries.wasp/
      El código R se basa en :
      Durbin, J. y Koopman, S. J. (2001) Análisis de series de tiempo por métodos de espacio de estados, Oxford University Press.
      Harvey, A. C. (1993) Modelos de series de tiempo. Segunda edición, Harvester Wheatsheaf.

      Para citar Wessa.net en publicaciones use:
      Wessa, P. (2021), Software de estadísticas gratuito, Oficina de Desarrollo de la Investigación y Educación,
      versión 1.2.1, URL https://www.wessa.net/

      & copy Todos los derechos reservados. Licencia académica solo para uso no comercial.
      El uso gratuito del contenido científico, los servicios y las aplicaciones de este sitio web se otorga únicamente para uso no comercial. En cualquier caso, la fuente (url) siempre debe mostrarse claramente. Bajo ninguna circunstancia se le permite reproducir, copiar o redistribuir el diseño, la disposición o cualquier contenido de este sitio web (para uso comercial), incluidos los materiales contenidos en este documento, sin el permiso expreso por escrito.

      La información proporcionada en este sitio web se proporciona "TAL CUAL" sin garantía de ningún tipo, ya sea expresa o implícita, incluidas, entre otras, las garantías de comerciabilidad, idoneidad para un propósito particular y no infracción. Hacemos esfuerzos razonables para incluir información precisa y oportuna y actualizar periódicamente la información y el software sin previo aviso. No ofrecemos garantías ni representaciones en cuanto a la precisión o integridad de dicha información (o software), y no asume responsabilidad alguna por errores u omisiones en el contenido de este sitio web, o cualquier error de software en aplicaciones en línea. El uso de este sitio web es BAJO SU PROPIO RIESGO. Bajo ninguna circunstancia y bajo ninguna teoría legal seremos responsables ante usted o cualquier otra persona por cualquier daño directo, indirecto, especial, incidental, ejemplar o consecuente que surja de su acceso o uso de este sitio web.


      Cómo crear un histograma

      1. Recopile al menos 50 puntos de datos consecutivos de un proceso.
      2. Utilice una hoja de trabajo de histograma para configurar el histograma. Le ayudará a determinar el número de barras, el rango de números que entran en cada barra y las etiquetas de los bordes de la barra. Después de calcular W en el Paso 2 de la hoja de trabajo, use su criterio para ajustarlo a un número conveniente. Por ejemplo, puede decidir redondear 0,9 a un 1,0 par. El valor de W no debe tener más lugares decimales que los números que graficará.
      3. Dibuja los ejes xey en papel cuadriculado. Marque y etiquete el eje y para contar valores de datos. Marque y etiquete el eje x con el L valores de la hoja de trabajo. Los espacios entre estos números serán las barras del histograma. No permita espacios entre barras.
      4. Para cada punto de datos, marque un recuento por encima de la barra correspondiente con una X o sombreando esa parte de la barra.

      Dibuje & # xa0ogives & # xa0 para la siguiente tabla que representa la distribución de frecuencia de los pesos de 36 estudiantes. & # Xa0

      Para dibujar ojivas para la distribución de frecuencia anterior, tenemos que escribir menos que y más que la frecuencia acumulada como se indica a continuación.

      Ahora, tenemos que escribir los puntos de menos y más que la frecuencia acumulada como se indica a continuación.

      Puntos de menos de la frecuencia acumulada:

      (43,50, 0), (48,50, 3), (53,50, 7), (58,50, 12), (63,50, 19), (68,50, 28) y (73,50, 36)

      Puntos de más & # xa0 frecuencia acumulativa:

      (43,50, 36 (48,50, 33), (53,50, 29), (58,50, 24), (63,50, 17), (68,50, 8) y (73,50, 0)

      Ahora, tomando la frecuencia en el eje horizontal, los pesos en el eje vertical y trazando los puntos anteriores, obtenemos ojivas como se indica a continuación.

      Después de haber repasado todo lo anterior, esperamos que los estudiantes hayan entendido "Representación gráfica de una distribución de frecuencia". & # Xa0

      Aparte de las cosas mencionadas anteriormente, si desea obtener más información sobre la "Representación gráfica de una distribución de frecuencia", haga clic aquí.

      Aparte de las cosas "Representación gráfica de una distribución de frecuencia", si necesita cualquier otra cosa en matemáticas, utilice nuestra búsqueda personalizada de Google aquí.

      Si tiene algún comentario sobre nuestro contenido matemático, envíenos un correo electrónico a: & # xa0

      Siempre agradecemos sus comentarios. & # Xa0

      También puede visitar las siguientes páginas web sobre diferentes temas de matemáticas. & # Xa0


      Ver el vídeo: 1Curso-Estadística-Histograma y Polígonos de frecuencias02062021 (Octubre 2021).