Saltar la navegación

Acumulando en continuo

Ya hemos visto cómo se agrupan los datos cuando se utilizan variables cualitativas y cuantitativas discretas. ¿Qué ocurre con las continuas.

La dificultad que tienen las variables continuas, al agrupar por frecuencias, lo puedes comprobar con el siguiente ejemplo:

Para las prácticas de laboratorio de los alumnos de bachillerato se van a encargar una serie de batas. Una tienda de la zona ofrece las batas de varias medidas distintas en cuanto al largo. Para poder pedir las que se necesitan, se decide hacer un estudio de las alturas de los alumnos de laboratorio. Una vez medidos los alumnos, se obtienen las siguientes estaturas (en centímetros):

183, 164, 159, 176, 173, 168, 155, 168, 162, 161, 172, 174, 178, 184, 160, 181, 165, 167, 163, 172, 178, 161, 158, 170, 179

Si pretendiéramos realizar una agrupación de los datos, como en el caso de las variables cuantitativas discretas, nos encontraríamos con que hay muchos valores distintos. En concreto,  desde el menor valor (155) hasta el mayor (184), hay 30 valores distintos. Pero, además, muchos de ellos no aparecen ninguna vez, por ejemplo el 156 o el 175. Por tanto, tendrías una tabla muy grande y con bastantes valores de frecuencia nula.

En estos casos, para evitar ese problema, lo que se hace es agrupar los datos en intervalos semicerrados. En este enlace puedes practicar los diferentes tipos de intervalos en la recta numérica.

La forma de completar la tabla es la siguiente: se cuentan cuántos valores distintos hay entre el valor mayor y el menor (en este caso es 30) y se dividen proporcionalmente en el número de intervalos que queramos conseguir. Lo normal es que el número de intervalos no sea menor que cinco ni mayor que diez.

En este caso; si quisiéramos tener cinco intervalos, necesitaríamos que su amplitud fuese de 6 centímetros cada uno. Entonces construiríamos la siguiente tabla.

 

Estaturas en cm

Intervalos

fi
 Fi hi
 Hi  % %acum.
[155,161)
4
 4  0,16 0,16  16 16
[161,167) 6 10  0,24 0,40  24 40
[167,173) 6
16
0,24 0,64 24
64
[173,179) 5
21
0,20 0,84
20 84
[179,185) 4
25
0,16 1,00 16 100
N =
25
         

 

Lo primero es calcular la frecuencia absoluta. Para ello, sólo hay que tener en cuenta un detalle importante: los intervalos son cerrados por la izquierda y abiertos por la derecha. Esto quiere decir que si tienes un valor que corresponde con dónde termina un intervalo y empieza el siguiente, ese valor debes contarlo en el segundo intervalo y no en el primero. Esta es una norma que se sigue usualmente.

Lo que debe quedarte claro es que no puedes contarla en ambos intervalos o estarías duplicando los valores y te saldrían más valores de los que has recogido.

Una vez que tengas la frecuencia absoluta, el resto se calcula como lo hemos hecho con el otro tipo de variables. Sólo hay un concepto nuevo,  que definimos a continuación.

Importante

Cuando la variable estadística es cuantitativa continua los valores se agrupan en intervalos. Todos los intervalos deben tener la misma amplitud; de forma que recojan todos los valores posibles, desde el menor al mayor. Cuando un dato es el que sirve de división para pasar de un intervalo al siguiente, sólo se contabiliza en el segundo intervalo.

Se llama marca de clase de un intervalo al valor medio del intervalo (se calcula sumando los extremos y dividiendo entre dos). Se suele considerar que los valores que están dentro del intervalo se distribuyen a un lado y otro de la marca. Equivale en total como si todos los valores del intervalo valiesen lo mismo que la marca de clase. Por eso, lo vamos a representar por x; ya que va a sustituir al valor de la variable como si fuese una variable cuantitativa  discreta.

De esta manera, la tabla anterior; al añadir la columna correspondiente a las marcas de clase (columna xi ); quedaría de la siguiente forma:

 

Estaturas en cm

Intervalos

 xi fi
Fi hi
Hi % %acum.
[155,161)
158 4
4 0,16 0,16 16 16
[161,167) 164
6 10 0,24 0,40 24 40
[167,173) 170
6
16
0,24 0,64 24
64
[173,179) 176
5
21
0,20 0,84
20 84
[179,185) 182 4
25
0,16 1,00 16 100

 N = 25

 

 

En el siguiente enlace puedes ver la construcción de la tabla anterior mediante OpenOffice.calc.

Aprende a hacerlo

Carniceria clan
CARNICERIA CLAN CREW. Carniceria clan (CC BY-SA)

En mi barrio acaban de abrir una pequeña carnicería. El dueño, para saber cuántos kilogramos de carne debe traer, decide hacer un estudio para saber cuántos kilogramos de carne vende en el primer mes. Las cantidades, redondeadas a kilogramos, han sido las siguientes:

13, 25, 28, 31, 24, 46, 15, 20, 32, 19, 28, 18, 21, 31, 25, 29, 35, 18, 27, 33, 26, 35, 43, 20, 35, 28, 23

Construye una tabla de frecuencias que tenga 6 intervalos de la misma amplitud, comenzando en el valor más pequeño que aparece. Escribe en la segunda columna la marca de clase. Completa la tabla con todas las frecuencias y % que hemos visto.

Utiliza OpenOffice.calc para elaborar la tabla y guárdala con el nombre carne.ods. Una vez obtenida, escribe la tabla en a tu cuaderno.