Elementos y Construcción de Modelos Estadísticos: Una Guía Completa
Elementos de un Modelo Estadístico
2.1 Variables
En todo modelo estadístico, se distinguen los siguientes elementos:
- Variables:
- Variable explicada, variable respuesta, variable regresada, variable dependiente, variable a predecir (representada por y).
- Variables explicativas, variables regresores, variables independientes, variables predictores (representadas por x).
2.2 Coeficientes
Los coeficientes indican la contribución de las variables explicativas para explicar la variable explicada (y). El símbolo más utilizado en econometría es la letra griega beta (β).
2.3 Término de Error del Modelo: e
El término de error (e) es una variable aleatoria que representa la parte del modelo que no se explica por las variables explicativas. También se conoce como la perturbación aleatoria del modelo. En e se incluye todo lo que no se ha formulado explícitamente en el modelo.
2.4 Los Datos
Los datos son la materia prima sobre la que operan los modelos. La clasificación de los datos económicos permite agruparlos en:
- Datos de sección cruzada: Se consideran procedentes de una muestra aleatoria, por lo tanto:
- Ausencia de correlación entre ellos.
- El orden de su presentación es irrelevante.
- Se aplican fundamentalmente en el modelo de regresión.
- Datos de series temporales: Se caracterizan por:
- Estar en sucesión temporal.
- El ordenamiento temporal es determinante.
- Existe correlación (asociación) entre las observaciones.
- Se utilizan en modelos de series temporales, pero también con modelos de regresión, si se cumplen determinadas condiciones.
- Datos de panel:
- Son una mezcla de datos de sección cruzada y de series temporales.
- Se tratan con modelos de datos de panel.
- No se consideran en este curso.
Pasos para la Construcción de un Modelo Estadístico
El procedimiento para la construcción de un modelo es iterativo y se representa en los siguientes pasos:
- Conocimientos previos: teoría económica, estadística, etc.
- Formulación del modelo.
- Recogida de datos.
- Estimación del modelo.
- Diagnosis del modelo:
- Si el modelo es válido, se pasa al siguiente paso.
- Si el modelo no es válido, se vuelve al paso 2.
Escritura de Modelos Estadísticos
Existen diferentes formas de escribir un modelo estadístico:
Primera forma: forma desplegada
- Regresión simple: El modelo de regresión simple solo tiene una variable explicativa: 𝑦𝑖 = 𝛽1 + 𝛽2𝑥2𝑖 + e ; 𝑖 = 1 … n
- Regresión múltiple: Son varias las variables explicativas, en general: 𝑘𝑦𝑖 = 𝛽1 + 𝛽2𝑥2𝑖 + 𝛽3𝑥3𝑖 + … + 𝛽𝑘𝑥𝑘𝑖 + 𝑒𝑖 ; 𝑖 = 1 … n
Segunda forma: forma semidesplegada
Si agrupamos en un vector los valores de y, de las x, de los coeficientes β y de las perturbaciones e, entonces podemos escribir el modelo de regresión como: 𝑦 = 𝑥′𝛽 + e
Tercera forma: forma matricial
𝑦 = 𝑋𝛽 + 𝑒
Los vectores y matrices se suelen escribir en negrita, pero por rapidez en su escritura se prescinde de la negrita. O sea: 𝑦 = 𝑋𝛽 + 𝑒
Si se acepta el principio de que los vectores y matrices se indican con letras mayúsculas, entonces se puede encontrar escrito el modelo de regresión en formato matricial como: 𝑌 = 𝑋𝛽 + 𝐸
Residuos del Modelo
Los residuos son una aproximación al término de error de un modelo. Se calculan una vez estimado el modelo y se les conoce como e-hat (̂𝑒).
Obtención de Estimadores
El objetivo es obtener la mejor línea recta, es decir, la línea recta más ajustada a los datos. La línea recta más ajustada a los datos es aquella que dé la menor suma de residuos al cuadrado. Para minimizar esta función, tenemos que derivar respecto a cada estimador, igualar a cero y comprobar que estamos en la situación de mínimos. En definitiva, hemos obtenido los estimadores 𝛽̂ 1 y 𝛽̂ 2 que nos dan el mínimo de la suma de los residuos al cuadrado y, por tanto, nos muestran la mejor línea recta ajustada a estos datos.
Supuestos del Modelo
2. Supuestos sobre la forma funcional
- El modelo de regresión es estocástico. Siempre tiene que estar presente el término de error del modelo: 𝑒.
- El modelo de regresión está correctamente especificado. No es posible estar seguro de este supuesto. Lo contrario se denomina errores de especificación.
- El modelo de regresión es lineal en los coeficientes. Esto no impide que las variables puedan venir elevadas, por ejemplo, al cuadrado.
- Los coeficientes del modelo de regresión son constantes.
- El modelo de regresión se dice causal en el sentido de que las variables explicativas explican la variable explicada, y no al revés.