martes, 14 de junio de 2016

Recta de regresión lineal

ENUNCIADO.
Se han realizado cinco Sobservaciones de dos variables estadísticas $X$ e $Y$, obteniendo los siguientes datos:
Se pide:
a) La recta de regresión de $Y$ sobre $X$
b) El valor estimado $\hat{y}$, para $x=2{,}3$
c) El coeficiente de correlación lineal
d) El coeficiente de determinación

SOLUCIÓN.
A continuación damos una reseña de las fórmulas que se utilizan en el cálculo de la recta de regresión lineal de $Y$ sobre $X$, si bien este ejercicio es de carácter práctico y, por tanto, puede realizarse con la ayuda de la calculadora científica básica, empleando las utilidades estadísticas.

La recta de regresión lineal de $Y$ sobre $X$ en la forma punto-pendiente es $$y-\bar{y}=\dfrac{s_{xy}}{s_{x}^2}\,(x-\bar{x})$$ siendo la covarianza $s_{xy}=\displaystyle \dfrac{1}{5}\sum_{i=1}^{5}{x_{i}^2}-\bar{x}\cdot \bar{y}$, las varianzas se calculan mediante las fórmulas $s_{x}^2=\dfrac{1}{5}\,\displaystyle \sum_{i=1}^{5}\,x_{i}^2-(\bar{x})^2$ y $s_{y}^2=\dfrac{1}{5}\,\displaystyle \sum_{i=1}^{5}\,y_{i}^2-(\bar{y})^2$; y, las medias se calculan así: $\bar{x}=\displaystyle \dfrac{1}{5}\,\sum_{i=1}^{5}\,x_i$ y $\bar{y}=\displaystyle \dfrac{1}{5}\,\sum_{i=1}^{5}\,y_i$

La ecuación de la recta de regresión lineal podemos expresarla también en forma explícita $$y=m\,x+k$$ donde $m=\dfrac{s_{xy}}{s_{x}^2}$ y $k=\bar{y}-m\,\bar{x}$

Pasemos ya sin más preámbulos a los cálculos. Entrando los datos en la calculadora científica básica ( tipo Casio fx82MS ) , en modo de regresión lineal ( MODE 3 1 ):
1,20 M+
2,32 M+
3,39 M+
4,55 M+
5,58 M+
y consultando los resultados mediante S VAR:
encontramos:
$m=9{,}9$ ( pulsando la tecla B de la penúltima pantalla, en S-VAR ) y $k=11{,}1$ ( pulsando la tecla A de la penúltima pantalla, en S-VAR )
luego la recta de regresión lineal de $Y$ sobre $X$ es $$y=9{,}9\,x+11{,}1$$

b)
Sustituyendo $x$ por $2{,}3$ en la ecuación de la recta de regresión lineal de $Y$ sobre $X$, obtenemos $\hat{y}=33{,}87$.

También podemos emplear las utilidades de la calculadora, tecleando directamente ( en la última pantalla de S-VAR ):  $2{,}3$$\hat{y}$, obteniendo como respuesta $33{,}87$

c)
El coeficiente de correlación lineal podemos consultarlo también directamente en la penúltima pantalla de S-VAR, pulsando la tecla correspondiente a $r$, y obtenemos $r=0{,}9847$.

Recordemos que $-1 \le r \le 1$, por lo que el valor ( alto ) que hemos obtenido indica un buen ajuste; el signo positivo, indica que la función de regresión lineal de $Y$ sobre $X$ ( y también la de $X$ sobre $Y$ ) tiene pendiente positiva, como ya hemos visto antes.

d)
La fuerza del ajuste viene dada por el coeficiente de determinación $R^2=(r)^2=0{,}9696$, que es un valor muy alto, pues hay que recordar que $0 \le R^2 \le 1 $ y, en este caso, está muy próximo a $1$.


$\square$