jueves, 9 de junio de 2016

Estadística descriptiva de una variable. Comparando conjuntos de datos.

ENUNCIADO. En una competición de lanzamiento de dardos entre dos jugadores, $A$ y $B$, se han obtenido los siguientes puntuaciones ( en una escala del cero al cinco ):
Calcular los parámetros de centralización y de dispersión para cada conjunto de puntuaciones; dibujar los diagramas de caja y bigotes de cada uno; y, de acuerdo, con los resultados, decidir quien es el lanzador más hábil. Razonar convenientemente la respuesta.

SOLUCIÓN.

El cálculo de la media y de la mediana de ambos conjuntos de datos nos lleva al mismo valor, que es $2$; si bien la moda del conjunto $B$ queda medio punto por debajo de la del conjunto $A$ ( que es, también, $2$ ), nos vemos obligados a realizar un estudio pormenorizado sobre la dispersión de datos de sendos conjuntos, para poder decidir quien ( de los dos lanzadores de dardos ) es el mejor. Observación: En el supuesto de que la media de uno de los dos hubiese sido ligeramente superior a la del otro, también deberíamos estudiar la dispersión, pues con pocos lanzamientos, el éxito del lanzador con una media algo superior a la del otro podría haberse debido a lo fortuito más que a la habilidad.

Conjunto de puntuaciones de A:

Es evidente que la moda, $M_o$, es $2$ ( valor que aparece más veces ); además, $\text{rango}=4-0=4$; y, en cuanto a los cuartiles: $Q_1=1$, $Q_2=M_e=2$ y $Q_3=3$, luego el rango inter-cuartílico es $\text{RIC}\overset{\text{def}}{=}Q_3-Q_1=2$

Procedemos, ahora, a calcular la media y el coeficiente de variación. Con ayuda de la calculadora científica y entrando los datos en modo de cálculo estadístico, obtenemos:
$\bar{x}=2$
y
$s = 1{,}1952$
por tanto, el coeficiente de variación es $CV\overset{\text{def}}{=}\dfrac{s}{\bar{x}}\approx 60\,\%$


Conjunto de puntuaciones de B:

La moda, $M_o$, es $\dfrac{1+2}{2}=1{,}5$; el rango es $\text{rango}=5-0=5$; los cuartiles son los mismos que los del primer conjunto de datos: $Q_1=1$, $Q_2=M_e=2$ y $Q_3=3$, luego el rango inter-cuartílico es, también, $\text{RIC}\overset{\text{def}}{=}Q_3-Q_1=2$

Procedemos, ahora, a calcular la media y el coeficiente de variación. Con ayuda de la calculadora científica y entrando los datos en modo de cálculo estadístico, obtenemos:
$\bar{x}=2$
y
$s = 1{,}519$
por tanto, el coeficiente de variación es $CV\overset{\text{def}}{=}\dfrac{s}{\bar{x}}\approx 76\,\%$

Los diagramas de caja y bigotes se pueden ver en la siguiente figura, donde el diagrama de arriba corresponde al conjunto de datos de $A$, y el de abajo al conjunto de datos de $B$:

A la vista de los diagramas de caja, es claro que la dispersión de los datos de $B$ es superior a la dispersión de los de $A$, lo cual se pone de manifiesto, también, comparando los coeficientes de variación. Por consiguiente, decidimos que el mejor lanzador es $B$. $\square$