Diagnóstico del modelo

regresion diagnostico

¿Qué tan viable es el uso de los modelos?

Authors

Affiliations

Eduardo Selim M. M.

 

Carlos A. Ar.

 

Published

May 20, 2021

DOI

Residuales estandarizados y studentizados

Identificación de outliers

Detección de relaciones no-lineales omitidas

Puntos de influencia

Leverage

Importante

Una observación con leverage alto no necesariamente es de influencia.

“Un punto de leverage alto puee o no ser de influencia”

Distancia de Cook

Una sugerencia para que un punto sea de influencia es que no sólo sea outstanding en los valores de x si no también en los de y.

La distancia de cook es una medida que combina ambas dimensiones.

Una manera directa de evaluar la influencia de las observaciones individuales es estudiar los cambios en la varibale respuesta ajustada si se elimina dicha observación.

Supóngase que se elimina la i-ésima observación y se ajusta un modelo de regresión con las n1 observaciones restantes.

ˆyj(i): valor ajustado de ˆy calculado en ausencia de la observación i

Distancia de cook

Di=nj=1(ˆyjˆyj(i))2(k+1)S2

Donde S2 es el MSE calculado con el data-set completo

Footnotes