Elementos y Construcción de Modelos de Regresión

Elementos de un Modelo de Regresión

En todo modelo de regresión cabe distinguir los siguientes elementos: variables, coeficientes, término de error y datos.

Variables

y: variable explicada, variable respuesta, variable regresada, variable dependiente, variable a predecir.

X: variables explicativas, variables regresores, variables independientes, variables predictores.

Coeficientes

Indican las aportaciones de las variables explicativas para explicar la y: la variable explicada. El símbolo más utilizado en econometría es la letra griega β: beta.

Término de Error del Modelo: e

Variable aleatoria, pieza clave del modelo. También conocida como la perturbación aleatoria del modelo. En la e se incluye todo lo que de manera explícita no aparece formulado en el modelo.

Los Datos

Es la materia sobre la que operan los modelos. La clasificación de los datos económicos permite agruparlos en:

  • Datos de sección cruzada
  • Datos de series temporales
  • Datos de panel

1 Datos de Sección Cruzada

Se consideran procedentes de una muestra aleatoria, por tanto:

  1. Ausencia de correlación entre ellos
  2. El orden de su presentación es irrelevante
  3. Se aplican fundamentalmente en el modelo de regresión

2 Datos de Series Temporales

Se caracterizan estos datos por:

  1. Estar en sucesión temporal
  2. El ordenamiento temporal es determinante
  3. Y, en consecuencia, existe correlación (asociación) entre las observaciones
  4. Se utilizan en Modelos de Series Temporales, pero también con modelos de regresión, si se cumplen determinadas condiciones

3 Datos de Panel

  1. Son datos mezcla de datos de sección cruzada y de series temporales
  2. Son tratados con modelos de Datos de Panel
  3. No se consideran en este curso

Pasos para la Construcción de un Modelo

El procedimiento para la construcción de un modelo es iterativo, o repetitivo, y viene representado en los siguientes pasos:

  1. Conocimientos previos: teoría económica, estadística, etc.
  2. Formulación del modelo
  3. Recogida de datos
  4. Estimación del modelo
  5. Diagnosis del modelo:
    • ¿Válido?, pasar al siguiente paso
    • ¿No válido?, volver al paso segundo
  6. Utilización del modelo

Escritura de Modelos

Primera Forma: Forma Desplegada

1 Regresión Simple

El modelo de regresión simple sólo tiene una variable explicativa:

yi = β1 + β2x2i + ei ; i = 1 … n

2 Regresión Múltiple

Son varias las variables explicativas, en general: k

yi = β1 + β2x2i + β3x3i + … + βkxki + ei ; i = 1 … n

Segunda Forma: Forma Semidesplegada

Si agrupamos en un vector los valores de la y, de las x, de los coeficientes β y de las perturbaciones e, entonces podemos escribir el modelo de regresión como:

y = x’β + e

Tercera Forma: Forma Matricial

y = Xβ + e

Los vectores y matrices se suelen escribir en negrita, sin embargo, por rapidez en su escritura se prescinde de la negrita. O sea:

y = Xβ + e

Si se acepta el principio de que los vectores y matrices se indican con letras mayúsculas, entonces se puede encontrar escrito el modelo de regresión en formato matricial como:

Y = Xβ + E

Residuos del Modelo

Los residuos son una aproximación al término de error de un modelo. Se calculan una vez estimado el modelo, y se les conoce como ê, pronunciado: e-hat.

Obtención de Estimadores

El objetivo es obtener la mejor línea recta. O, en otras palabras, obtener la línea recta más ajustada a los datos.

La línea recta más ajustada a los datos es aquella que dé la menor suma de residuos al cuadrado.

Para minimizar esta función, tenemos que derivar respecto a cada estimador, igualar a cero, y comprobar que estamos en la situación de mínimos.

En definitiva, hemos obtenido los estimadores β̂1 y β̂2 que nos dan el mínimo de la suma de los residuos al cuadrado, y por tanto, nos muestran la mejor línea recta ajustada a estos datos.

Supuestos del Modelo

Supuestos sobre la Forma Funcional

  • El modelo de regresión es estocástico. Siempre tiene que estar presente el término de error del modelo: e.
  • El modelo de regresión está correctamente especificado. No es posible estar seguro de este supuesto. Lo contrario se denomina errores de especificación.
  • El modelo de regresión es lineal en los coeficientes. Esto no impide que las variables puedan venir elevadas, por ejemplo, al cuadrado.
  • Los coeficientes del modelo de regresión son constantes.
  • El modelo de regresión se dice causal en el sentido de que las variables explicativas explican la variable explicada, y no al revés.