sábado, 8 de septiembre de 2012

Ejercicios de estadística descriptiva ( artículo escrito en catalán )


Exercici 1:
En un hospital s'ha subministrat diferents dosis d'un medicament antifebrigen a $10$ pacients (amb febre alta) i s'ha mesurat el temps necessari per normalitzar la temperatura. Els resultats figuren a la taula de sota



Designant amb $Y$ a la variable estadística temps, i amb $X$ a la variable estadística dosi, us demanem:
    a) La representació gràfica del núvol de punts $\{P(x_i,y_i)\}$
    b) El valor de la covariància $\sigma_{xy}$ entre $X$ i $Y$
    c) El valor de la variància $\sigma_{x}^2$ de la variable $X$
    d) El valor de la mitjana aritmètica $\bar{x}$ de la variable $X$
    e) El valor de la mitjana aritmètica $\bar{y}$ de la variable $Y$
    f) El valor del coeficient de correlació lineal (o de Pearson) entre les variables $X$ i $Y$
    g) L'equació de la recta de regressió lineal de $Y$ sobre $X$ en forma explícita ( $y=a+b\,x$ ), concretant els valors dels coeficients $a$ i $b$, i explicant la relació que tenen aquests coeficients amb els paràmetres esmentats als apartats anteriors.
    h) Representeu la recta de regressió lineal calculada a l'apartat anterior damunt del núvol de punts que heu dibuixat al primer apartat.
    i) Per a una dosi de $25 \; \text(mg)$, quin temps estimat $\hat{y}$ li correspon ? Interpreteu el resultat de forma crítica.


      [Resolució (no mireu la resolució abans d'intentar fer l'exercici)]



Exercici 2:
La taula de sota mostra els valors d'una variable estadística contínua $X$, agrupats en intervals (classes):




Us demanem:
    a) l'histograma de freqüències ( $f$ enfront de $X$ )
    b) l'histograma de freqüències acumulades ( $F$ enfront de $X$ )
    c) el valor del mode (o moda) $M_{0}$
    d) el valor de la mediana $M$ ( o segon quartil )
    e) el valor del primer quartil $Q_1$
    f) el valor del tercer quartil $Q_3$
    g) el valor del rang
    h) el valor del interquartílic
    i) dibuixeu el diagrama de caixa i bigotis i comenteu què en podem concloure sobre la distribució dels valors de $X$ (a nivell qualitativament)
    j) el valor de la mitjana aritmàtica $\bar{x}$
    k) el valor de la desviació estàndard $\sigma$
    l) el tant per cent de valors (sobre el total) tals que $X \le 67$
    m) el tant per cent de valors (sobre el total) tals que $X \le 22$
    n) el tant per cent de valors (sobre el total) tals que $22 \le X \le 67$


      [Resolució (no mireu la resolució abans d'intentar fer l'exercici)]



Solucions de l'exercici 1:

    d) $\bar{x}=11$

    e) $\bar{y}=77,6$

    b)
Tenint en compte que
$\displaystyle \sigma_{xy}=\dfrac{1}{N}\,\sum_{i=1}^{n}\,x_{i}\,y_{i}\,f_{i} - \bar{x}\,\bar{y}$
on $N=10$, $n=10$, $f_i=1$ ( $i=1,\ldots\,10 $)
sabent també (calculadora) que
$\sum_{i=1}^{n}\,x_{i}\,y_{i}\,f_{i}=6466$
i tenint en compte els resultats dels apartats d i e, trobem que
$\sigma_{xy}=-207$
Comentari: el valor negatiu de la covariància mostra el fet que si $X$ creix/decreix, llavors $Y$ decreix/creix

    c)
De la calculadora (havent entrat les dades) trobem directament
el valor de $\sigma_{x} \approx 5,74$
i, per tant, elevant al quadrat (amb totes les xifres decimals en pantalla), trobem
$\sigma_{x}^2 = 33$

    f)
El coeficient de correlació lineal (o de Pearson) es calcula fent
$r=\dfrac{\sigma_{xy}}{\sigma_{x}\,\sigma_{y}}$
no obstant, consultant les funcions estadístiques de la calculadora científica (havent entrat les dades), podem veure directament el seu valor
$r \approx -0,9843$
Observació: El valor negatiu de $r$ és concordant amb el valor negatiu de $\sigma_{xy}$; el pendent de la recta de regressió ha de ser negatiu.

    g)
Els coeficients de l'equació en forma explícita de la recta de regressió de $Y$ sobre $X$
$y=a+b\,x$
es poden consultar directament a la calculadora (havent entrat les dades):
$a \approx 146,6$
$b \approx -6,3$
on
i)   $b=\dfrac{\sigma_{xy}{}}{\sigma_{x}^2}$
ii) &nbps $a=\bar{y}-b\,\bar{x}$
Llavors, l'equació de la recta de regressió és
$r:\,y=146,4-6,3\,x$

    h)
Per representar la recta de regressió, trobem les coordenades de dos punts de $r$; i, en particular, per comoditat i sentit pràctic, escollim els punts d'intersecció amb els eixos de coordenades
$A(0,147)$
i
$B(x_{0},0)$
on $x_0$ designa l'arrel de la funció $f(x)=146,6-6,3\,x$
que és igual a
$x_0 \approx 23,3$

Observem, doncs, que el domini significatiu de la funció de regressió és l'interval
$\left[0\,,\,23,3\right]$


    i)
És ben clar que $25$ no pertany al domini de la funció: el valor de dosi $x=25$ queda a la dreta de $x_0$ [l'arrel de la recta de regressió (per a una dosi d'aquest valor, el temps necessari per restablir la temperatura és - teòricament - nul] i, per tant, no caldria subministrar més quantitat de medicament que $23,3 \, \text{mg}$

Observació:
De fet, si calculem $\hat{y}$ per a $x=25$ trobem - lògicament - un resultat absurd: un valor negatiu del temps de restabliment de la temperatura.

$\square$



Solucions de l'exercici 2:

    a) [histograma]

    b) [histograma]


    c)
Consultant l'histograma de freqüències ( $f$ enfront de $X$ ), veiem que
$40 < M_{0} < 60$ és a dir $M_{0}=40+a$ plantejant la proporció corresponent als costats corresponents dels dos triangles semblants que es configuren amb els traços de les abscisses i ordenades, calculem el valor de $a$ $a=\dfrac{10}{3}$ i, per tant, trobem que $M_{0}=40+\dfrac{10}{3}$ quantitat que, aproximada, queda $M_{0} \approx 43$


    d)
Consultant l'histograma de freqüències acumulades ( $F$ enfront de $X$ ), ens adonem que [ entrant a l'eix de les freqüències amb el valor $F=250 \div 2 = 125$ ]
$40 < M <60$ i, amb més precisió $M=40+b$ Calculem el valor de $b$ plantejant la proporció corresponent als costats corresponents dels dos triangles semblants que es configuren amb els traços de les abscisses i ordenades, i trobem $b=\dfrac{15}{4}$ Llavors $M=40+\dfrac{15}{4}$ i, per tant, $M \approx 44$


    e)
Consultant l'histograma de freqüències acumulades ( $F$ enfront de $X$ ), ens adonem que [ entrant a l'eix de les freqüències amb el valor $F=250 \div 4 = 62,5$ ]
$20 < Q_{1} <40$ i, amb més precisió $Q_{1}=40+c$ Calculem el valor de $c$ plantejant la proporció corresponent als costats corresponents dels dos triangles semblants que es configuren amb els traços de les abscisses i ordenades, i trobem $c=\dfrac{44,8}{7}$ Llavors $Q_{1}=20+\dfrac{44}{8}$ i, per tant, $Q_{1} \approx 26$


    f)
Consultant l'histograma de freqüències acumulades ( $F$ enfront de $X$ ), ens adonem que [ entrant a l'eix de les freqüències amb el valor $F=125+250 \div 4 = 187,5$ ]
$40 < Q_{3} < 60$ i, amb més precisió $Q_{3}=40+d$ Calculem el valor de $d$ plantejant la proporció corresponent als costats corresponents dels dos triangles semblants que es configuren amb els traços de les abscisses i ordenades, i trobem $d=\dfrac{77,5}{4}$ Llavors $Q_{3}=40+\dfrac{44}{8}$ i, per tant, $Q_{3} \approx 59$


    g)
$\text{rang}=x_{màx}-x_{mín}$ i, per tant, és igual a $120$

    h)
$\text{RIQ}=Q_{3}-Q_{1}$ i, per tant, és igual a $33$

    i) [ diagrama de caixa i bigotis ]

    j)
Entrant les marques de classe $\{10,30,50,70,90,110\}$ amb les respectives freqüencies
$\{40,70,80,30,20,10\}$ podrem consultar els paràmetres estadístics amb les funcions estadístiques de la calculadora científica
$\bar{x}=46$

    k)
consultant els paràmetres estadístics amb les funcions estadístiques de la calculadora científica
$\sigma_{x} \approx 26$

    l)
consultant l'histograma de freqüències acumulades (atenció al poligon de freqüencies), entrant a l'eix horitzontal amb el valor de $X=67$, trobem que el nombre de valors inferiors a aquest valor és igual a (cal fer la proporció necessària, si cal) $201$, que correspon a un $80 \, \text{\%}$

    m)
consultant l'histograma de freqüències acumulades (atenció al poligon de freqüencies), entrant a l'eix horitzontal amb el valor de $X=22$, trobem que el nombre de valors inferiors a aquest valor és igual a (cal fer la proporció necessària, si cal) $201$, que correspon a un $22 \, \text{\%}$

    n)
Restant els valors obtinguts als apartats l i m, trobem que el nombre de valors de $X$ que es troben entre $X=22$ i $X=67$ és igual a $58 \, \text{\%}$

$\square$


[autoría]

No hay comentarios:

Publicar un comentario

Gracias por tus comentarios