Fundamentos del Modelo Básico de Regresión Lineal: Hipótesis, Modelos y Validez
Fundamentos del Modelo Básico de Regresión Lineal
1. Hipótesis del Modelo Básico de Regresión
- Hipótesis de parámetros constantes: Los parámetros β deben ser constantes a lo largo de la muestra y en el futuro.
- Hipótesis de los grados de libertad: El rango de la matriz X debe ser igual al número de variables (K) y menor que el número de datos (n).
- Hipótesis de normalidad: La perturbación aleatoria tiene una distribución N (0, ∂2), siendo ∂2 la varianza constante.
2. Especificación del Modelo
Partiendo del siguiente modelo especificado:
C1 = β0 + β1xRD1 + β2xP1 + u1
Obtenemos los siguientes modelos para España y Francia:
El primer modelo corresponde a la etapa de especificación, donde se definen las variables que intervienen y la relación funcional entre ellas. En este caso, es un modelo básico de regresión de las variables C1 (endógena), RDt y Pt (explicativas exógenas), y Ut, que es la variable explicativa (perturbación aleatoria) que indica la parte no explicada de la variable endógena por omisión de variables relevantes.
Los modelos 2 y 3 son modelos econométricos diferentes, basados en la estructura económica, ya que se han estimado los parámetros. Estos dos modelos son independientes entre sí, representando la etapa de estimación y contraste.
3. Generalidad vs. Validez de los Modelos
Generalidad: El intento de concreción a un sistema real frente a la vocación de generalidad del modelo económico supone la pérdida de generalidad en las conclusiones a las que puede llegarse mediante su aplicación. El modelo econométrico tiene, por tanto, una validez limitada respecto al sistema de referencia y al periodo temporal en que tal modelo tenga vigencia como representación del sistema.
Validez de los modelos: El modelo econométrico exige una especificación estadística de las variables que lo componen. Requiere una forma funcional o relación matemática definida, mientras que un modelo económico puede decidir no explicitar la forma funcional, o solo imponerle ciertos requisitos. La dinamicidad propia de los sistemas reales obliga a considerar explícitamente el tiempo en la mayoría de los modelos econométricos. Se incorpora la componente de azar propia de los sistemas reales, es decir, el modelo econométrico incluye variables aleatorias también concretadas en el modelo que son variables estocásticas (medibles) denotadas como Ut, las variables aleatorias son valores desconocidos que comprenden todas las variables no incluidas en el modelo (residuos).
4. Tipos de Modelos de Investigación Científica
- Modelo mental: Representación no explícita de un sistema. No es un modelo explicativo y, por ello, no constituye un soporte adecuado para el pensamiento científico.
- Modelo verbal: Descripción en lenguaje ordinario del modelo mental. Permite el conocimiento científico siempre que la ambigüedad del lenguaje ordinario quede reducida por la incorporación de conceptos propios y por la aplicación de criterios de formalización.
- Modelo físico: Representación material o mediante objetos de un sistema. Es una forma admisible de conocimiento científico, pero con aplicación prácticamente nula.
- Modelo matemático o algebraico: Descripción del sistema con ayuda del lenguaje matemático. Constituye la forma más estricta de conocimiento de una realidad.
5. Hipótesis Básicas de Aleatoriedad del MBRL
Las hipótesis básicas referidas a las perturbaciones aleatorias indican que la perturbación aleatoria tiene una distribución con varianza constante. Desarrollando esta hipótesis obtenemos:
- Hipótesis de estacionalidad media: La media de la perturbación aleatoria es nula. En una especificación correcta del modelo, el término residual no introducirá un error de forma sistemática.
- Hipótesis de homocedasticidad: La varianza de Ut es constante, es decir, todas las perturbaciones aleatorias tienen la misma varianza. Por lo tanto, esta es independiente del tiempo o de los valores de X.
- Hipótesis de incorrelación serial: La covarianza será 0, es decir, no hay autocorrelación. Las perturbaciones correspondientes a distintos momentos de tiempo no están relacionadas entre sí (responden a una muestra aleatoria).