Regresión lineal múltiple

regresion

Repaso de regresión lineal con múltiples variables explicativas.

Authors

Affiliations

Eduardo Selim M. M.

 

Carlos A. Ar.

 

Published

May 26, 2021

DOI

y=β0+β1x1+β2x2+...+βkxk+ϵfunción de regresión

Muestralmente

(yi,xi1,xi1,...,xikCovariables, variables predictoras,features, variables explicativas),    i=1,2,...,nDonde n es el número de observaciones.

Entonces yi=β0+β1xi1+...+βkxik+ϵi donde ϵiN(0,1) además de ser i.i.d.

Como antes

E(yi)=β0+β1xi1+...+βkxik

Interpretación muy popular es que βj es el cambio esperado en y, por unidad de cambio en xj (ceteris paribus) puesto que

E(yi)xj=βj

En términos matriciales

(y1y2yn)yn×1=(1x11x12x1k1x21x22x2k1xn1xn2xnk)Xn×(k+1)Matríz de covariablesMatriz de diseño(β0β1βk)β(k+1)×1+(ϵ1ϵ2ϵn)ϵn×1

Nos hacemos las mismas preguntas de siempre

¿ˆβ? ¿Cómo obtengo los estimadores?

yiˆyi,                        ei=yiˆyi

La certidumbre tanto de ˆβ como de ˆy(i.e. intervalos de confianza)

Predicción: ¿Cómo se comporta el modelo ante variables explicativas no observadas?

Future Engineering, selección de variables¿Qué variables aportan a explicar y?

Estimador de β

Se obtiene por mínimos cuadrados

Como antes

RSS=ni=1(yiˆy)2RegSS=ni=1(ˆyiˉy)2 Estamos comparando el modelo de regresiónTSS=ni=1(yiˉy)2=(n1)S2yVersus el modelo naiiveValor F:=RegSS/kRss/(n(k+1))Se utiliza para evaluar si las k variables explicativasson colectivamente útiles para explicar.

F=nk1kR21R2

Ahora sí a construir el intervalo de confianza.

Intervalo de confianza para ˆβ

Está dado por

ˆβj±tn(k+1),α2S2(XTX)1j1,j+1

Footnotes