El Modelo Lineal General (MLG)
¿Qué es el Leverage?
El leverage es un número que refleja la cercanía de los valores extramuestrales X20, X30,…, Xk0, a sus respectivas medias muestrales. Cuanto más cerca está Xj0 de su media Xj, menor es el leverage. El leverage también refleja la intensidad de la relación lineal entre las variables explicativas. Cuanto mayor sea la relación lineal entre las variables explicativas, mayor es el leverage.
CONTRASTE DE CHOW
Cambio estructural
Un cambio estructural de un modelo es una modificación en la relación de las variables explicativas con la dependiente, es decir, es un cambio en uno o más de los coeficientes βj con j = 1,…, k
Situación extraordinaria dentro de la muestra
Se ha producido una situación extraordinaria que afecta a una parte de la muestra. Esa situación extraordinaria puede provocar (o no) un cambio estructural en el modelo.
- Si la situación extraordinaria ha provocado un cambio estructural, será necesario utilizar dos modelos: uno en presencia (antes) de la situación extraordinaria y otro sin la presencia (después) de la situación extraordinaria.
- Si la situación extraordinaria NO ha provocado un cambio estructural, con un solo modelo será suficiente.
VARIABLES DUMMY
Cómo incluir variables cualitativas en un MLG
Las variables explicativas cualitativas se introducen en el MLG utilizando variables ficticias o dummy que permiten interpretar de forma natural el efecto de las variables cualitativas en la variable dependiente Y utilizando los mismos métodos que para las variables explicativas cuantitativas.
Definición variable dummy o ficticia
Una variable dummy o ficticia es una variable binaria que toma el valor 1 si el individuo posee una categoría de una variable cualitativa y 0 si no la posee.
Inclusión de variables dummies en un MLG
Las variables dummy se introducen en el MLG exactamente igual que una variable explicativa cuantitativa Xj siempre y cuando se deje fuera una de las variables dummy.
Es decir, siempre tiene que haber una categoría de la variable cualitativa que no tiene asignada variable dummy en el modelo.
Un MLG con β1 en el que se introducen todas las variables dummy correspondientes a una variable cualitativa incurre en la trampa de las variables dummy o ficticias.
Trampa de las variables dummy
Un MLG con β1 en el que se introducen todas las variables dummy de una variable cualitativa presenta un problema de multicolinealidad perfecta (incumplimiento S9).
RESIDUO ȗ
El residuo es una variable que recoge la diferencia entre el valor observado y el estimado de Y. Es una aproximación del error o perturbación del modelo econométrico.
ȗ = Y – Ŷ
SUPUESTOS CLÁSICOS
Los supuestos clásicos en el MLG, necesarios para hacer inferencia, son una generalización del MLS más dos nuevos.
- SUPUESTO 1. El MLG es lineal en los parámetros.
- SUPUESTO 2. Los valores de las variables Xj son fijos o son independientes de u.
- SUPUESTO 3. La media de la perturbación es igual a cero [E (u|X2,…, Xk) = 0].
- SUPUESTO 4. HOMOCEDASTICIDAD var(u|X2,…, Xk) = σ2.
- SUPUESTO 5. NO AUTOCORRELACIÓN [cov(uj, us|X2,…, Xk) = 0 ∀j ≠ s].
- SUPUESTO 6. El número de observaciones n es mayor que el número de parámetros a estimar [n > k + 1].
- SUPUESTO 7. La naturaleza de las variables Xj. Deben tener varianza muestral.
- SUPUESTO 8. NORMALIDAD. ui ~ N (0,σ2) ∀i.
- SUPUESTO 9. NO multicolinealidad exacta entre las variables explicativas, Xj. No hay relación lineal exacta entre las variables Xj. Ninguna variable Xj se puede expresar como combinación lineal exacta del resto de variables explicativas.
- SUPUESTO 10. No hay sesgo de especificación. El modelo está especificado correctamente.
PROPIEDADES ALGEBRAICAS DE LOS RESIDUOS MCO
- El modelo estimado siempre pasa a través de las medias muestrales.
- La media de Y estimada es igual a la media de Y observada.
- La media (o la suma) de los residuos MCO es siempre cero.
- Los residuos no están correlacionados con el valor estimado de Y.
- Los residuos no están correlacionados con cada
COEFICIENTES R2 Y R̅2
R2
Mide la calidad o bondad de ajuste del modelo estimado (= interpretación que en MLS).
Inconveniente del R2: Si se introduce una variable explicativa más en un MLG, el R2 siempre crece, aunque la variable no aporte nada al modelo (sea una variable irrelevante). En otras palabras, para mejorar la calidad de ajuste del MLG se pueden introducir más variables explicativas, aunque éstas no aporten a la explicación de Y.
Por mejorar la calidad de ajuste, se complica la estimación e interpretación del modelo. Los modelos complejos con muchas variables explicativas irrelevantes se alejan del principio de parsimonia.
COEFICIENTE DE DETERMINACIÓN CORREGIDO R̅2
R̅2 es una medida de bondad de ajuste que tiene en cuenta el número de parámetros k (variables Xj + 1) del modelo en relación a n (tamaño de la muestra). Cuanto mayor sea k en relación a n, menor es R̅2 (peor calidad de ajuste).