miércoles, 7 de septiembre de 2016

Ejercicio de estadística descriptiva de una variables, con sus valores agrupados en clases

ENUNCIADO. Se ha realizado un estudio sobre una cierta característica de una población y se han obtenido las siguientes medidas de la misma: $$10,12,21,29,28,32,36,38,41,44,50,51$$ $$19,18,25,22,21,37,32,35,46,46,50,42$$ $$17,14,25,25,24,33,38,39,47,41,44,56$$ $$35,34,37,30,33,35\phantom{00000000000000000}$$ Se pide:
Elaborar el diagrama de tallo y hojas. A continuación, agrupar los valores en intervalos, todos ellos de amplitud igual a $10$, y determinar los siguientes parámetros estadísticos: moda, cuartiles, media,varianza, disviación estándar, coeficiente de variación, rango, y rango intercuartílico. Elaborar, también, los histogramas y el diagrama de caja y bigotes.

SOLUCIÓN.
Diagrama de tallo y hojas:

Si observamos el diagrama de tallo y hojas, y realizamos un estudio discreto del conjunto de datos, vemos que la distribución es bimodal, pues dos de los valores ( y no sólo uno ) se repiten con mayor frecuencia; éstos son $25$ y $35$. Ahora bien, es mucho más razonable que hagamos un estudio continuo de la distribución, agrupando los datos ( tal como se pide en el enunciado ).

A continuación mostramos la tabla de frecuencias ( y frecuencias acumuladas ) que resulta de la agrupación de los datos en los intervalos que figuran en la primera columna ( las marcas de clase son los números de la segunda columna ):


Así, vemos que la moda está en el intervalo $[30,40)$; precisando un poco más y empleando la semejanza de triángulos al trazar los segmentos que une el punto superior derecha (respectivamente, superior izquierda) del rectángulo de mayor altura con el punto inferior izquierda ( respectivamente, inferior derecha ).


La abscisa del punto de intersección de estos segmentos nos da el valor de la moda. Veamos qué resulta de los cálculos:
$$\dfrac{a}{15-9}=\dfrac{10-a}{15-12}$$ luego $$a=\dfrac{20}{3}$$ y, por tanto, la moda es igual aproximadamente ( la agrupación en clases no da resultados exactos ) a $$M_o \approx 30+a = 36,7$$


Diagrama de caja y bigotes:
A partir del estudio continuo ( datos agrupados en intervalos/classes ) y trabajando con el histograma de frecuencias acumuladas ( cuarta columna de la tabla ), obtenemos el siguiente resultado aproximado ( recordemos que al agrupar en intervalos, renunciamos a los resultados exactos ).


Se omiten los cálculos rutinarios de proporcionalidad con los triángulos semejantes ( similares al que se ha detallado arriba, para el cálculo de la moda ) que se forman al trabajar con la línea poligonal de frecuencias acumuladas, en el correspondiente histograma:
Nota: En la lista no hay datos atípicos, pues ninguno de ellos cumple alguna de estas condiciones: $$ x < Q_1-RIC$$ $$ x > Q_3+RIC$$

Se ve con claridad que el rango es igual a $56-10=46|$

El cálculo de los demás parámetros puede realizarse con ayuda de la calculadora científica, para ello debemos introducir las cuatro parejas (marca de clase, frecuencia respectiva) que tenemos anotadas ya en la tabla de frecuencias, y consultar los resultados en la calculadora.

Introducción de datos ( en una calculadora científica básica Casio fx-82MS ):
MODE 2 (modo estadístico con 1 variable )
15;6 M+
25;9 M+
35;15 M+
45;12 M+



Consultando los valores de los parámetros:

Tecleando S-VAR ( con los datos introducidos ). Se puede comprobar que aparecen los siguientes resultados [Nota: Conviene, sin embargo, escribir las definiciones de dichos parámetros ]

media: $\bar{x}\overset{\text{def}}{=}\dfrac{1}{N}\,\displaystyle \sum_{i=1}^{4} x_i\,f_i\approx 32,9$

varianza: $s_{x}^2\overset{\text{def}}{=}\dfrac{1}{N}\,\displaystyle \sum_{i=1}^{4} x_{i}^{2}\,f_i-(\bar{x})^2\approx 102,6$

desviación estándar: $s_x\overset{\text{def}}{=}\sqrt{s_{x}^2}\approx 10,1$

coeficiente de variación: $CV\overset{\text{def}}{=}\dfrac{s_x}{\bar{x}} \approx 31\,\%$

$\square$

No hay comentarios:

Publicar un comentario

Gracias por tus comentarios