jueves, 1 de junio de 2017

Un ejemplo de distribución estadística en la que aparecen datos atípicos

ENUNCIADO. Consideremos la siguiente distribución de valores estadísticos de una variable $X$ $$\{2,3,4,9, 10, 11, 10, 10, 12, 10, 12, 11, 13, 13, 14, 10\}$$ ¿ Hay entre éstos algún valor atípico ?

SOLUCIÓN. Adoptamos el siguiente criterio para decidir si un cierto valor es atípico. Decimos que un valor $k$ de la distribución de una variable estadística $X$ es atípico si $k \notin I$, siendo $I$ el intervalo $( Q_1-1,5\cdot \text{RIQ}\,,\,Q_3-1,5\cdot \text{RIQ})$, donde $\text{RIQ}=\left|Q_3-Q_1\right|$ ( rango intercuartílico ), siendo $Q_1$, $Q_2$ y $Q_3$, el primer, segundo y tercer cuartil, respectivamente.

Procedamos, por tanto, a calcular los extremos de dicho intervalo, y, para ello, deberemos calcular los cuartiles.

Ordenando estos $16$ valores obtenemos $$\{2,3,4,9, 10, 10, 10, 10, 10, 11, 11, 12, 12, 13, 13, 14\}$$ Como hay un número par de valores, el centro de la distribución viene dado por dos valores, que son $x_{8}$ y $x_{9}$, y ambos son igual a $10$, luego el segundo cuartíl ( o mediana ) es $$Q_2=10$$ Por otra parte al tener la primera mitad ( de la distribución ) $7$ valores ( un número impar ) el valor que separa las dos primeras cuartas partes es $x_4=9$, luego el primer cuartil es $$Q_1=9$$

Veamos ahora cuál es el tercer cuartíl. Desde luego, hay también $7$ valores en la segunda mitad de la distribución, pues hemos considerado ya los $7$ de la primera mitad y los dos valores centrales que constituyen la mediana o segundo cuartil. Dividiendo ésta en dos cuartas partes, tendremos $3$ valores en cada una ( $x_{10}$, $x_{11}$ y $x_{12}$ ), siendo por tanto $x_{13}=12$ el valor que ha de corresponder al tercer cuartíl. Así pues $$Q_3=12$$

Por tanto $\text{RIQ}=12-9=3$, con lo cual $1,5 \cdot \text{RIQ} = 1,5 \cdot 3 =4,5$. Luego el intervalo $I$ vendrá dado por $(9-4,5\,,\,12+4,5)$, esto es, $I=(4,5\,,\,16,5)$. Y es evidente que $\{2,3,4\}$ no está incluido en $I$, por consiguiente podemos decir que los valores $2$, $3$ y $4$ son valores atípicos.

Observación:
Estos valores se representan con asteriscos en el diagrama de Tukey ( o de 'caja y bigotes' ). La longitud de de los bigotes no puede ser superior a $1,5 \cdot \text{RIQ} = 4,5$. Veamos cómo queda dicho diagrama:


$\square$

No hay comentarios:

Publicar un comentario

Gracias por tus comentarios