miércoles, 27 de abril de 2016

Calcular los cuartiles, la moda, la media, la varianza ...

ENUNCIADO. La recogida de datos sobre una cierta característica ( variable estadística $X$ ) de una población, viene dada en la siguiente tabla :


Se pide:
a) Completar la tabla y entrar los datos necesarios en la calculadora científica ( en modo de cálculo estadístico de $1$ variable ) para obtener los valores de los parámetros estadísticos: media y desviación estándar
b) ¿ Cuál es el valor de la varianza ?
c) Calcular el coeficiente de variación. ¿ Para qué sirve dicha medida ?
d) Dibujar el histograma de frecuencias absolutas
e) Obtener la moda
f) Dibujar el histograma de frecuencias absolutas acumuladas
g) Obtener los cuartiles
h) Dibujar el diagrama de caja y bigotes
i) A modo de conclusión, describir de manera concisa los rasgos más importantes de la distribución de los valores de dicha variable estadística

SOLUCIÓN.
a)

Entrada de datos en una calculadora científica básica ( no\ programable y con pantalla de 2 líneas ) Casio fx-82MS:
MODE REG (2)
    15;6 M+
          "n=6"
    15;50 M+
          "n=56"
    35;60 M+
          "n=116"
    45;30 M+
          "n=146"
    55;12 M+
          "n=158"

Cálculo de la media y de la desviación estándar:
$\bar{x}\overset{\text{def}}{=}\dfrac{1}{N}\,\displaystyle \sum_{i=1}^{k}\,x_{i}\,f_i$, donde $N=158$ y $k=5$
$s_{x}\overset{\text{def}}{=}\sqrt{\dfrac{1}{N}\,\displaystyle \sum_{i=1}^{k}\,(x_{i}\,f_i-\bar{x})^2}=\sqrt{\left(\dfrac{1}{N}\,\displaystyle \sum_{i=1}^{k}\,x_{i}^2\,f_i\right)-(\bar{x})^2}$

Consultando en la calculadora:
S-VAR
  (1) -> $\bar{x} \approx 34'5$
  (2) -> $s_x \approx 9'8$

b)
Como $s_x \approx 9'8 \Rightarrow s_{x}^2 \overset{\text{def}}{=} (s_x)^2 \approx 96'0$

c)
Coeficiente de variación:
$\text{CV}\overset{\text{def}}{=}\dfrac{s_x}{\bar{x}}\approx\dfrac{9'8}{34'5}=28\,\%$
Esta medida expresa el grado de dispersión de la distribución, relativo a la media. Sirve para comparar la dispersión de varios conjuntos de datos.

d)
Histograma de frecuencias absolutas del recuento y obtención de la moda:

Es claro que $30 \prec M_o \prec 40$, luego $M_o=30+a$. Procedemos a calcular $a$ empleando la semejanza de los triángulos de la figura. Como $$\dfrac{a}{10-a}=\dfrac{60-50}{60-30}$$ despejando $a$ encontramos $a=2'5$, luego $M_o\approx 32'5$

f-g)

En la figura se puede apreciar la obtención gráfica de los cuartiles; su cálculo pormenorizado, a partir de las semejanzas entre los triángulos que se configuran son los siguientes:

Observemos que $30 \prec Q_2 \prec 40$, luego $Q_2=30+b$. Calculando $b$ por semejanza de triángulos, $\dfrac{b}{10}=\dfrac{79-56}{116-56} \Rightarrow b=3'8$; así, $Q_2=30+3'8=30'8$

Observemos que $20 \prec Q_2 \prec 30$, luego $Q_2=20+c$. Calculando $c$ por semejanza de triángulos, $\dfrac{c}{10}=\dfrac{39'5-6}{56-6} \Rightarrow c=6'7$; así, $Q_1=20+6'7=26'7$

Observemos que $40 \prec Q_2 \prec 50$, luego $Q_3=40+d$. Calculando $d$ por semejanza de triángulos, $\dfrac{d}{10}=\dfrac{118'5-116}{146-116} \Rightarrow d=0'8$; así, $Q_3=40+0'8=40'8$


h)

i)
Visualmente, se observa una cierta asimetría a la derecha ( en el histograma de frecuencias del recuento, así como en el diagrama de caja y bigotes ); esto viene corroborado por el hecho de que la mediana ( el segundo cuartil ) se sitúa a la derecha de la moda. $\square$