El Modelo Lineal General (MLG)

¿Qué es el Leverage?

El leverage es un número que refleja la cercanía de los valores extramuestrales X₂₀, X₃₀,…, X_k0, a sus respectivas medias muestrales. Cuanto más cerca está X_j0 de su media X_j, menor es el leverage. El leverage también refleja la intensidad de la relación lineal entre las variables explicativas. Cuanto mayor sea la relación lineal entre las variables explicativas, mayor es el leverage.

CONTRASTE DE CHOW

Cambio estructural

Un cambio estructural de un modelo es una modificación en la relación de las variables explicativas con la dependiente, es decir, es un cambio en uno o más de los coeficientes β_j con j = 1,…, k

Situación extraordinaria dentro de la muestra

Se ha producido una situación extraordinaria que afecta a una parte de la muestra. Esa situación extraordinaria puede provocar (o no) un cambio estructural en el modelo.

Si la situación extraordinaria ha provocado un cambio estructural, será necesario utilizar dos modelos: uno en presencia (antes) de la situación extraordinaria y otro sin la presencia (después) de la situación extraordinaria.
Si la situación extraordinaria NO ha provocado un cambio estructural, con un solo modelo será suficiente.

VARIABLES DUMMY

Cómo incluir variables cualitativas en un MLG

Las variables explicativas cualitativas se introducen en el MLG utilizando variables ficticias o dummy que permiten interpretar de forma natural el efecto de las variables cualitativas en la variable dependiente Y utilizando los mismos métodos que para las variables explicativas cuantitativas.

Definición variable dummy o ficticia

Una variable dummy o ficticia es una variable binaria que toma el valor 1 si el individuo posee una categoría de una variable cualitativa y 0 si no la posee.

Inclusión de variables dummies en un MLG

Las variables dummy se introducen en el MLG exactamente igual que una variable explicativa cuantitativa X_j siempre y cuando se deje fuera una de las variables dummy.

Es decir, siempre tiene que haber una categoría de la variable cualitativa que no tiene asignada variable dummy en el modelo.

Un MLG con β₁ en el que se introducen todas las variables dummy correspondientes a una variable cualitativa incurre en la trampa de las variables dummy o ficticias.

Trampa de las variables dummy

Un MLG con β₁ en el que se introducen todas las variables dummy de una variable cualitativa presenta un problema de multicolinealidad perfecta (incumplimiento S9).

RESIDUO ȗ

El residuo es una variable que recoge la diferencia entre el valor observado y el estimado de Y. Es una aproximación del error o perturbación del modelo econométrico.

ȗ = Y – Ŷ

SUPUESTOS CLÁSICOS

Los supuestos clásicos en el MLG, necesarios para hacer inferencia, son una generalización del MLS más dos nuevos.

SUPUESTO 1. El MLG es lineal en los parámetros.
SUPUESTO 2. Los valores de las variables X_j son fijos o son independientes de u.
SUPUESTO 3. La media de la perturbación es igual a cero [E (u|X₂,…, X_k) = 0].
SUPUESTO 4. HOMOCEDASTICIDAD var(u|X₂,…, X_k) = σ².
SUPUESTO 5. NO AUTOCORRELACIÓN [cov(u_j, u_s|X₂,…, X_k) = 0 ∀j ≠ s].
SUPUESTO 6. El número de observaciones n es mayor que el número de parámetros a estimar [n > k + 1].
SUPUESTO 7. La naturaleza de las variables X_j. Deben tener varianza muestral.
SUPUESTO 8. NORMALIDAD. u_i ~ N (0,σ²) ∀i.
SUPUESTO 9. NO multicolinealidad exacta entre las variables explicativas, X_j. No hay relación lineal exacta entre las variables X_j. Ninguna variable X_j se puede expresar como combinación lineal exacta del resto de variables explicativas.
SUPUESTO 10. No hay sesgo de especificación. El modelo está especificado correctamente.

PROPIEDADES ALGEBRAICAS DE LOS RESIDUOS MCO

El modelo estimado siempre pasa a través de las medias muestrales.
La media de Y estimada es igual a la media de Y observada.
La media (o la suma) de los residuos MCO es siempre cero.
Los residuos no están correlacionados con el valor estimado de Y.
Los residuos no están correlacionados con cada

COEFICIENTES R² Y R̅²

R²

Mide la calidad o bondad de ajuste del modelo estimado (= interpretación que en MLS).

Inconveniente del R²: Si se introduce una variable explicativa más en un MLG, el R² siempre crece, aunque la variable no aporte nada al modelo (sea una variable irrelevante). En otras palabras, para mejorar la calidad de ajuste del MLG se pueden introducir más variables explicativas, aunque éstas no aporten a la explicación de Y.

Por mejorar la calidad de ajuste, se complica la estimación e interpretación del modelo. Los modelos complejos con muchas variables explicativas irrelevantes se alejan del principio de parsimonia.

COEFICIENTE DE DETERMINACIÓN CORREGIDO R̅²

R̅² es una medida de bondad de ajuste que tiene en cuenta el número de parámetros k (variables X_j + 1) del modelo en relación a n (tamaño de la muestra). Cuanto mayor sea k en relación a n, menor es R̅² (peor calidad de ajuste).